Как стать автором
Обновить

Все потоки

Сначала показывать
Порог рейтинга
Уровень сложности

Проблемы с логикой у LLM и с доверием не только у LLM

Уровень сложностиПростой
Время на прочтение20 мин
Количество просмотров121

Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые грамотными людьми, что свидетельствует о сходстве LLM с неграмотными людьми неспособными к абстрактному мышлению. В ближайшем будущем LLM не сможет достичь уровня логического мышления грамотного человека, зато LLM обладает большими чем у человека способностями к эриксоновскому гипнозу, а значит и к мошенничеству.

Читать далее
Рейтинг0
Комментарии3

Новости

Анонимный RAT при глобальном наблюдателе

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров266

Удалённый доступ может быть как очень опасной программной функцией, так и очень полезной - всё зависит от контекста, намерений, задач и целей с которыми подобные программы будут применяться. Такая же ситуация с анонимностью и анонимными коммуникациями в общем. Они могут как скрывать злонамеренную активность, так и скрывать законную активность от посторонних, которым её выявление может быть выгодно как по финансовым, так и по политическим причинам. Вследствие этого, технология остаётся нейтральной, ровно, как и любая полезная, и в это же самое время потенциально опасная вещь.

Читать далее
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Как оживить Кандинский матрицами вращений для генерации видео (часть 1-я)

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров121

В статье коснемся темы матриц вращений и особенно их версии для многомерных пространств. Матрицы вращений широко используются в задачах 3D моделирования, для контролируемого поворота объекта. Но как оказалось, можно посмотреть на них шире и применить к многомерному латентному пространству диффузионных моделей. И первые опыты показали применимость матриц вращений при решении задачи генерации видео из текста. Статья (1-я часть) основана на моей магистерской работе в МФТИ, которую защитил в июне 2024г.

Читать далее
Всего голосов 2: ↑1 и ↓10
Комментарии0

Шагающий аэростат однажды сможет исследовать Титан или морское дно Земли

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров347

15.07.2024, Энди Toмасвик, universetoday.com

Новые способы перемещения по другим небесным телам всегда привлекают внимание сообщества исследователей космоса. Мы сообщали о многих разработках Техасского университета: от роботов, которые подвешиваются к стенам марсианских пещер, до роботов, которые прыгают, используя струи добываемого на месте газа. Но мы еще не сообщали об идее аэростата, который «ходит». Но именно эта идея лежит в основе BALloon Locomotion for Extreme Terrain, или BALLET, проекта главного робототехника в Лаборатории реактивного движения NASA Хари Наяра и его коллег.

Читать далее
Всего голосов 4: ↑4 и ↓0+6
Комментарии0

Истории

Golang убивает PHP

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров3.6K

Последние несколько лет на рынке, по моему сугубо личному мнению, golang вытесняет PHP с рынка, а многие компании считают, что проекты, которые сейчас написаны и работают на PHP должны быть переписаны на golang, чтобы было хорошо.

Такой подход только частично является правдой. На самом деле каждый язык программирования предназначен на решение определенного вида задач, а вопросы производительности в основном зависят очень сильно от разработчика, а не от языка программирования.

Видя это несправедливое отношение PHP, хочу опубликовать ряд статей, в котором рассказывать об особенностях разработки, проблемах, которые нужно учитывать, а также участников разработки, которых также часто забывают, например, devops-инженеров.

Читать далее
Всего голосов 16: ↑9 и ↓7+10
Комментарии56

Как студенты двигатель Стирлинга строили

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.5K

Хочу рассказать вам историю, как студенты двигатель Стирлинга строили.. Результат вам не скажу). Пусть он будет интригой, как и для, на протяжении всего проекта.

Читать далее
Всего голосов 7: ↑5 и ↓2+5
Комментарии8

Все реки в порядке: как и зачем в географических науках ранжируют водотоки

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров704

Предлагаю погрузиться в одну увлекательную гидрологическую тему - ранжирование речных систем. Под катом я постарался привести материал полезный как для географов, которые сталкиваются с проблемой ранжирования векторного слоя рек с помощью геоинформационных систем (ГИС), так и для всех неравнодушных, которые иногда видели "красивые реки" на карте, но не знают, как именно они оформляются в картографических материалах

Посмотреть на реки
Всего голосов 2: ↑2 и ↓0+2
Комментарии4

Как я обучил модель, которая понимает русский лучше GPT 3.5 Turbo

Время на прочтение3 мин
Количество просмотров1.1K

В этой статье я расскажу, как я смог обучить модель, которая превзошла GPT 3.5 Turbo на русскоязычной части MT-Bench. Также я рассмотрю новую конфигурацию для обучения на двух графических процессорах параллельно с помощью accelerate и deepspeed.

Особенный интерес представляет мой датасет для обучения. Он получен из сабсета мультиязычных промтов набора lightblue/tagengo-gpt4 на русском, английском и китайском, всего 10 тысяч примеров, сгенерированных с помощью GPT-4o. Это в 8 раз меньше, чем исходный набор Tagengo, но обученная на последнем Suzume, как показали бенчмарки, лишь очень незначительно превосходит мою модель на ru_mt_bench, а на англоязычном бенче и вовсе уступает ей. Это значит, что я в разы сэкономил на GPU за счет более высокого качества данных, полученных с помощью GPT-4o. 

Я использовал скрипт для получения ответов по заданным промптам. Для генерации русскоязычной выборки я изменил часть скрипта, чтобы выбрать все промпты на русском из Tagengo (8K примеров), так как основной фокус при обучении модели был на русском языке. 

В итоге я получил датасет ruslandev/tagengo-rus-gpt-4o и приступил к обучению.

Для этого я создал виртуальную машину с NVIDIA H100, используя сервис immers.cloud. Для достижения наилучших результатов по instruction-following (что проверяется на MT-Bench) я взял в качестве исходной модели meta-llama/Meta-Llama-3-8B-Instruct. Именно на ней обучена модель Suzume, у которой высокая оценка на MT Bench. Предыдущие эксперименты показали, что базовая Llama-3 8B,  а особенно ее четырехбитная версия для QLoRA - unsloth/llama-3-8b-bnb-4bit - значительно отстает по оценкам бенчмарка.

Читать далее
Всего голосов 12: ↑11 и ↓1+13
Комментарии5

Простые, но редко используемые методы аналитики, которые улучшат показатели ваших рекламных кампаний

Время на прочтение11 мин
Количество просмотров247

Digital-аналитика рекламных каналов является неотъемлемой частью работы над маркетинговыми кампаниями.

Одним из самых результативных подходов при анализе рекламных кампаний является исследование показателей эффективности в разрезе различных сегментов.

На практике чаще всего используются следующие популярные разбивки:

Анализ в разрезе рекламных кампаний;

По ключевым словам и группам объявлений;

По типу устройств (смартфоны, планшеты, компьютеры);

По гео (города и страны);

По демографическим признакам (пол и возраст).

Как правило, в ходе исследования специалист разделяет трафик между сегментами и оценивает разницу в стоимости лида (CPL) либо стоимости заказа (CPO). Далее производятся соответствующие корректировки.

Подобный анализ может дать специалисту большой объем полезной информации, которая, будучи правильно учтенной, даст значительный положительный эффект.

Однако практика показывает, что стандартных сегментов часто оказывается недостаточно, и многие аналитики / маркетологи начинают задаваться вопросом: 

На что еще взглянуть в рекламных кампаниях, чтобы увеличить эффективность привлекаемого трафика?

Давайте разбираться! 

Читать далее
Всего голосов 2: ↑1 и ↓1+2
Комментарии1

Основы управления проектами: на чём следует сосредоточиться?

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров576

«Сосредоточьтесь на основах, делайте их хорошо и делайте их неустанно..»

Все менеджеры проектов знакомы с ними, и те, кто не являются менеджерами проектов, тоже их узнают. Проекты состоят из задач, вех, этапов, ресурсов различных типов, рисков, проблем и т. д. Каждая задача, срок или человек неделимы – атомы проекта, если хотите..

Я уверен, что у вас будет свой собственный список. И хотя я ожидаю, что ваш список во многом будет пересекаться, он вполне может отличаться в деталях. Вы можете не включать одну или две из моих лучших концепций, но при этом добавить несколько своих собственных. Скорее всего, у вас будет та же идея, но выразите ее по-своему.

Читать далее
Всего голосов 4: ↑0 и ↓4-4
Комментарии1

Памяти Кевина Митника — хакера, ломавшего ФБР, АНБ и Кремниевую долину. Часть 9: туман Сиэтла, саспенс и чёрный вертолёт

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров2.1K

Итак, из-за идиотского стечения обстоятельств Кевин Митник — который в кои-то веки действительно никоим образом не был виноват — был выброшен с работы, лишён фальшивой личности на имя Эрика Вайса и оказался вынужден срочно бежать из очень полюбившегося ему Денвера. Ему предстояло найти новое место обитания и наконец официально стать в глазах государства и общества никаким не Кевином Митником, а Брайаном Мерриллом. Для этого всё было готово, оставалось немногое: осесть где-то в месте, где есть спрос на айтишников, и постараться не привлекать к себе лишнего внимания новыми рискованными хакерскими похождениями. Если с первым в США середины 90-х всё было неплохо и разнообразно, то на второе Кевин был решительно неспособен: к чужим серверам и секретам его тянуло не меньше, чем ирландского пьянчугу к бутылке виски. А госпожа Фортуна не очень любит, когда её благосклонность испытывают раз за разом самым самонадеянным образом.
Читать дальше →
Всего голосов 17: ↑16 и ↓1+28
Комментарии0

Телеприсутствие, 3D-видеосвязь и НЕголографические будки

Время на прочтение12 мин
Количество просмотров477

Почему модные способы 3D-коммуникации никак не станут массовыми, какое отношение они имеют к голограммам и чем нас не устраивает просто видео.

Читать далее
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Информационное картографирование в экосистеме TON

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров827

Бросай тапать, начинай анализировать!

В статье показано, как с помощью информационных карт можно анализировать большие объёмы данных о транзакциях в блокчейне TON (The Open Network). Карты позволяют достичь ситуационной осведомленности о процессах, протекающих в достаточно запутанном виртуальном пространстве, порождаемом экосистемой TON. На примере карты транзакций, совершаемых за один день, рассмотрим основные компоненты такой экосистемы, а также научимся выявлять структурные особенности инструментов блокчейна, которые используют киберпреступники для своей противоправной деятельности. В основе статьи лежат исследования, опубликованные в научной работе «Информационное картографирование Blockchain-транзакций киберпреступников в экосистеме TON»

Читать далее
Всего голосов 3: ↑2 и ↓1+3
Комментарии1

Ближайшие события

Большие простые числа: теория и практика их поиска

Время на прочтение8 мин
Количество просмотров2.3K

Самое большое простое число, известное на данный момент, состоит из почти 25 млн. цифр. Есть ли простые числа больше? Несомненно. Простых чисел бесконечное количество. Найдём ли мы простое число больше 25 млн. цифр? Тоже да, поиск не останавливается ни на секунду. Можно ли принять в нём участие? Конечно, достаточно присоединиться к одному из добровольных распределённых проектов по поиску больших простых чисел.

Читать далее
Всего голосов 7: ↑6 и ↓1+7
Комментарии5

Dangerous Dave: история похождений Дейва или тот, кто сам стучится в дверь

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров2.2K

Id Software, Джон Кармак, Джон Ромеро. Любой человек, любящий шутеры и интересующийся жанром, при звучании этих слов сразу понимает о чем и о ком речь. И у кого-то в ушах в этот момент начинает греметь I Sawed the Demons, кто-то вспоминает рокетджамп и распрыжку, а кто-то — взбешенного Гитлера с двумя пулеметами вместо рук.

Еще бы не вспомнить! Ведь это, можно сказать, отцы шутеров от первого лица как жанра. Но прежде чем наши экраны обагрились кровью людей в фельдграу, демонов и прочей нечисти, будущие звезды реализовали еще несколько проектов. То была проба пера, предтеча грядущего ураганного экшена, что мы до сих пор помним.

Читать далее
Всего голосов 17: ↑16 и ↓1+19
Комментарии5

Быстрый поиск по разной документации

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров1.6K

Недавно я задался вопросом, могу ли я оптимизировать процесс поиска чего-либо в документации любого языка/библиотеки/фреймворка. Прыгать с сайта на сайт – не самая лучшая идея, ибо интерфейсы документацией отличаются, а я хотел унификации.

Сначала мне пришла мысль взглянуть на уже существующие решения, среди которых есть мною любимый Zeal, однако, он доступен только для Windows и Linux, я же крепко сижу в заложниках на MacOS из-за специфики работы и удобства.

На сайте Zeal предлагают перейти на сайт Dash, который по сути является прародителем Zeal, однако, он платный и за него невозможно заплатить в пределах РФ, поэтому я продолжил дальше искать аналоги.

Среди альтернатив также есть DevDocs, который может работать оффлайн в браузере (благодаря PWA), однако, я заметил, что все время держать открытой лишнюю вкладку для поиска в доках было не лучшей идеей (ибо вкладку все равно нужно было бы искать, среди тонны вкладок со StackOverflow и прочим).

Решение с быстрым поиском

В Firefox и Google Chrome есть возможность добавить собственную поисковую систему (или же поиск по сайту), чем собственно я и воспользовался. При поиске в devdocs все GET-запросы уходят по урлу:

Читать далее
Всего голосов 9: ↑7 и ↓2+7
Комментарии6

Что такое Data-Oriented ECS

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров452

В этой статье пойдет речь о довольно интересной реализации Entity System Component (ECS), а именно о Data-Oriented ECS (DOD ECS). Эта статья подойдет для тех, кто хочет ознакомиться с ECS, а в частности с его DOD ECS реализацией. В этой статье не будут рассматриваться детали конкретных реализаций или оптимизаций, вместо этого в статье будет описана принципиальная разница между классической ECS и DOD ECS, приведены особенности, преимущества и недостатки DOD ECS.

Читать далее
Рейтинг0
Комментарии1

Костюмы-стилсьюты, вдохновлённые «Дюной», могут позволить астронавтам перерабатывать мочу в воду

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.2K

Если история и учит нас чему-то, так это тому, что научная фантастика часто уступает дорогу научным фактам. Вспомните коммуникатор Star Trek и появление телефонов-раскладушек в конце 1990-х — начале 2000-х годов, или как в фильме «2001 год: Космическая одиссея» были предсказаны орбитальные космические станции и многоразовые космические самолёты, такие как Международная космическая станция (МКС) и «Спейс Шаттл». А кто может забыть классическую книгу Жюля Верна «С Земли на Луну» и её предвосхищение того, что однажды люди будут ходить по Луне? Почти столетие спустя эта мечта была реализована в рамках программы «Аполлон».

Последние новости поступили из Корнельского университета, где группа исследователей разработала новую систему сбора и фильтрации мочи в скафандре, вдохновлённую скафандрами, которые носили фримены в романе Фрэнка Герберта «Дюна». После интеграции в стандартный скафандр НАСА — Extravehicular Mobility Unit (EMU) — эта система способна обеспечить астронавтов дополнительным количеством воды и снизить риск возникновения медицинских проблем, связанных с гигиеной. Одним словом, технология скафандров может обеспечить более длительные миссии на поверхности Луны, Марса и орбитах.

Читать далее
Всего голосов 3: ↑3 и ↓0+7
Комментарии3

Как проектируют дата-центры? Разбираемся на практике

Время на прочтение10 мин
Количество просмотров4.1K

Стабильность IT-инфраструктуры напрямую зависит от дата-центра, в котором размещены серверы. Одно только расположение предопределяет подключение к электросети и другие коммуникации.

Привет, Хабр! Меня зовут Артём, я руководитель ИТО в Selectel. В этом материале расскажу, как проектируют дата-центры, и сделаю обзор на один из наших дата-центров — «Цветочная 2», который был запущен еще в 2015 году, 17 декабря. Разберем основные системы и покажем, как они выглядят в действии. Подробности под катом!
Читать дальше →
Всего голосов 21: ↑21 и ↓0+25
Комментарии4

nxs-marketplace-terraform: люби и пользуйся

Время на прочтение9 мин
Количество просмотров992

В этой статье рассмотрим процесс развертывания инфраструктуры в Yandex Cloud с использованием Terraform-модулей из репозитория nixys/nxs-marketplace-terraform. А ещё расскажем, зачем использовать динамические блоки в Terraform и почему файлы tfstate лучше хранить в S3.

Давайте разворачивать
Всего голосов 3: ↑3 и ↓0+5
Комментарии1
1
23 ...