Все потоки

Статьи +33 Новости +8 Хабы Авторы Компании

vsantonov 6 минут назад

Как сисадмин из Ульяновска попал в Кремниевую долину. Такая ли большая разница?

Простой

31 мин

128

Системное администрирование *IT-эмиграция DevOps *

Роадмэп

Все так, с момента написания прошлой статьи, которая вошла в топ 3 по количеству комментариев за 2022г, я получил грин карту, женился и переехал, как мечтал, в столицу всего айти мира. Статья будет про мой карьерный путь, из простого сисадмина в Ульяновске, до непростого в Кремниевой долине. Немного размышлений о текущем состоянии айти индустрии и о жизни в долине, которая совсем не такая, какой ее представляешь издалека.

На фото знаменитый сгоревший дом, который выставили на продажу за $800тыс.

Поехали

vlad_gatsenko 39 минут назад

NGINX подготовил бинарники для предварительной версии реализации QUIC+HTTP/3

5 мин

323

Open source *Nginx *Сетевые технологии *

Перевод

NGINX подготовил бинарники для предварительной версии реализации QUIC+HTTP/3: "Мы рады сообщить, что наша предварительная реализация поддержки NGINX для QUIC+HTTP/3 теперь доступна в виде предварительно собранных бинарных пакетов для двух дистрибутивов: Red Hat Enterprise Linux 9 и Ubuntu 22.04"

Подробности под катом.

Maccimo 56 минут назад

Пошаговая отладка, inline-методы, JVM

6 мин

172

Java *Kotlin *Ненормальное программирование *Отладка *Реверс-инжиниринг *

Recovery mode

В Java, как известно, inline-методов нет. Но такое понятие существует в других языках, исполняющихся на JVM. Например, в Scala или Kotlin. Во время компиляции вызов такого метода заменяется на его тело, как если бы разработчик написал этот код вручную.

Прекрасный инструмент для добавления синтаксического сахара и создания проблемно-ориентированных языков (DSL) малой ценой, но как это всё отлаживать?

С тем, какие ухищрения помогают не замечать расхождения исходного текста программы и её байткода во время отладки и предлагаю разобраться.

Читать дальше →

AlexKimen 1 час назад

Почему Chat GPT говорит по-русски с нейронным акцентом? Специфика токенизации кириллицы нейронной сетью от Open AI

Простой

3 мин

Искусственный интеллект Natural Language Processing *

Обзор

Увидев очередную статью об утомившем всех Chat GPT от Open AI, рука невольно тянется в ~~пистолету~~ минусатору. Ну, в самом деле, сколько можно? Уже, кажется, все успели поиграть с чатом во всевозможных сценариях.

Однако один аспект, почему-то, почти не затронут как на Хабре, так и в Рунете. Почему же все-таки Chat GPT говорит по-русски с весьма специфическим акцентом, который условно можно назвать «нейронным говорком»?

Чтобы понять суть вопроса, обратимся к теории. Чем занимается генеративная нейронная сеть такого типа?

Говоря просто и коротко она получает на вход набор токенов, пропускает их через некий «черный ящик» и выдает другой набор токенов. Вероятность выбора конкретного токена для ответа зависит от набора входящих токенов и конкретных настроек.

Но что же такое «токен»? Интересный факт заключается в том, что для английского языка токеном обычно выступают сочетания символов, зачастую совпадающие с короткими словами или часто встречающимися частями слов.

Возьмем, например, английскую панграмму:

«The quick brown fox jumps over the lazy dog»

Напомню, что панграмма – это предложение из минимального числа слов, содержащая в себе все буквы алфавита.

Официальный токенизатор Open AI https://platform.openai.com/tokenizer

Показывает, что в этом предложении всего 9 токенов, содержащих 43 символа.

andgenn 1 час назад

Обзор портативных газоанализаторов для измерения концентрации горючих и токсичных газов

Простой

7 мин

355

Блог компании Прогнозирование полигонов ТКО Экология

Обзор

Газоанализатор (газовый детектор, газосигнализатор) — это контрольно-измерительное устройство, предназначенное для измерения количества состава и концентрации одного измеряемого газа или группы измеряемых газов или паров в газовоздушной смеси.

В устройство газовая смесь подается на чувствительный элемент (ячейку, сенсор). Многокомпонентный портативный газоанализатор содержит несколько датчиков для различных газов в одном корпусе.

Стационарные приборы могут иметь несколько выносных блоков датчиков для определенных компонентов.

valvalva 2 часа назад

Самый простой пример CI/CD

Средний

6 мин

*nix *DevOps *

Туториал

Однажды подслушано:

- А… А что мы сейчас делаем?

- Деплой приложения.

- А что такое деплой?

- Деплой… Ну это деплой, что тут не понятного?

antirek 3 часа назад

filebump — хостинг файлов по API

3 мин

479

Анализ и проектирование систем *Node.JS *

У нас несколько сервисов, где пользователи загружают файлы, отправляют файлы, обмениваются файлами.

И делать в каждом сервисе свой сервер, где можно было бы получить ссылку на файл, передать через очередь, отправить, обработать - может быть не надо?

В одном сервисе - это загрузка аватарок, в другом - это различные пользовательские файлы, по сути в транзите, в третьем - это файлы, загружаемые для конфигурирования сервиса, используются время от времени.

В каждом сервисе надо было делать директорию для файлов, следить чтобы там было достаточно места, выставить права на запись, монтировать или синхронизировать с хранилищем по необходимости.

Поэтому появился filebump - простой http сервер, где мы можем загружать, хранить и скачивать файлы.

Viacheslav_V 3 часа назад

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

6 мин

429

Блог компании АЭРОДИСК Системное администрирование *IT-инфраструктура *Хранение данных *Хранилища данных *

Привет, Хабр! Начинаем серию статей с глубоким разбором функциональности СХД АЭРОДИСК серии 5. В этой статье речь пойдет об основе СХД – отказоустойчивости и производительности. Как работает, как правильно настраивать и какой результат можно получить. Более того, все то же самое и даже больше мы покажем в реальном времени на нашем следующем вебинаре Около-ИТ, который состоится 21 февраля 2023 в 15:00. Зарегистрироваться на вебинар можно по ссылке.

tockieteacute 8 часов назад

Как я завалил первый тех. собес на позицию Junior QA Engineer

7 мин

6.5K

Тестирование IT-систем *Тестирование мобильных приложений *Карьера в IT-индустрии

Из песочницы

Здравствуйте, меня зовут Артём, и я с ноября месяца изучаю тестирование. Спустя ровно два месяца я получил первое приглашение на техническое собеседование, позиция Junior QA Engineer, мобильная разработка, геймдев. Хотел бы поделиться этой историей с теми кому это может пригодиться, так как не все мои ожидания оправдались, а некоторые вопросы на собеседовании действительно поставили в тупик.

DRoman0v 9 часов назад

Музыкальные инструменты, клюшки для гольфа, PS2 и много Nintendo: новые покупки на испанской барахолке

3 мин

Блог компании Selectel Гаджеты Компьютерное железо История IT Старое железо

Привет, Хабр! Сегодня я в очередной раз побывал на испанской барахолке, благо, дождь, который прогнозировали на воскресенье, не пошел. Людей было как обычно много, включая как продавцов, так и покупателей. Я стараюсь приезжать пораньше, когда основная часть товара уже выложена, а большинство покупателей еще в пути. И такя стратегия себя обычно оправдывает. Сегодня приобрел несколько игровых консолей, поскольку оказалось, что среди моих знакомых есть немало ценителей винтажных систем. Что же, давайте приступим.

Читать дальше →

exwill 9 часов назад

Как недетерминированная GPT может выдавать четкие ответы

7 мин

2.1K

Искусственный интеллект

У человека, не погруженного в тему, внезапно нахлынувший вал сообщений о GPT может оставить противоречивые чувства. Эксперты разделились на два, на первый взгляд, равновеликих лагеря. Одни авторитеты говорят, что это "вау!". Другие уверенно заявляют, что GPT это "генератор бреда". Чтобы вы могли разобраться самостоятельно, я расскажу, как это работает

1CUnlimited 9 часов назад

Delayed durability поможет вашему ORM увеличить производительность на 50% и более, если Вы только будете использовать …

10 мин

826

Oracle *PostgreSQL *Программирование *Microsoft SQL Server *1С *

Туториал

Recovery mode

ORM (Object‑Relational Mapping) используется во многих языках программирования, в том числе и в 1С. Однако реализация высоконагруженных решений, приводит к мысли что разработчики ORM не учитывали ее влияния на производительность СУБД. Такая ситуация и в 1С и ORM на Java, и наверняка в других ORM. В предыдущих частях показана глубина проблемы

Концепция ORM как двигатель прогресса — выдержит ли ее ваша СУБД? / Хабр (habr.com)

Концепция ORM как двигатель прогресса – выявит слабое место Вашей СУБД / Хабр (habr.com)

В этой части предложено решение со стороны СУБД (MS SQL , Oracle, Postgres)

rastvl 9 часов назад

Chrome Headless против cloudflare JS challenge

Средний

41 мин

1.3K

JavaScript *Node.JS *Реверс-инжиниринг *

Из песочницы

Автоматизация сбора информации с различных ресурсов - обычная задача для людей разных сфер деятельности. Жаль, что не всегда бывает достаточно сделать простой GET запрос и разобрать полученный html. Веб-сайты, с которых собираются данные, принимают защитные меры для предотвращения автоматизированных запросов. Одной из таких мер является использование cloudflare. Сегодня мы посмотрим, как cloudflare выявляет ботов через javascript и коснёмся темы деобфускации скриптов.

+19

Kenya-West 11 часов назад

Как подключить ИИ-ассистента* на технологии OpenAI к мессенджерам* на вашем смартфоне**** (кликбейт)

Простой

8 мин

1.3K

Тестирование мобильных приложений *

Туториал

Recovery mode

^{Изображение взято из}^{https://www.niio.com/blog/what-is-ai-art-chatgpt/}

TL;DR

1. Заводим аккаунт OpenAI;
2. Качаем Autoresponder for TG, например, для Телеграма;
3. Создаем правило для всех сообщений с маской *, вставляем туда токен для GPT-3;
4. ???????
5. PROFIT!

Что-то непонятно, можно подробнее?

rozmysl 11 часов назад

Кластер ElasticSearch на 1Ptb+

Сложный

9 мин

Big Data *DevOps *

Из песочницы

Черновик статьи был написан еще год назад, когда я работал на крупном международном проекте, но из-за разных событий прошлого года он остался неопубликованным.

На проекте в моем ведении находилось несколько on-premise кластеров в нескольких европейских датацентрах. «Мы» в этой статье — небольшая команда DataOps из 5 человек.

Было дело я читал на Хабре статью про «Кластер Elasticsearch на 200 ТБ+» и примерял написанное к нам, у нас такой кластер считался средним, самый маленький кластер под 0,1Ptb, а большой тогда был под 0,5Ptb. Потом была поставлена задача подготовить кластер к увеличению объемов входящих данных в 2-3 раза, а срок хранения в 2 раза, т. е. объем хранимых данных, если грубо экстраполировать, должен был стать в районе 2-3Ptb.

Хочу поделиться нашим опытом, может кому пригодиться.

+10

digivent 12 часов назад

Как эффективно продвигать ивенты в digital?

Простой

5 мин

189

Разработка веб-сайтов *Управление проектами *Медийная реклама *Контекстная реклама *

Из песочницы

Мероприятия — один из лучших методов повышения лояльности и заинтересованности клиентов! Статистика показывает, что 9 из 10 посетителей после ивента интересуются продуктом компании. Однако, из-за неправильного подхода к продвижению, 78% мероприятий не набирают нужное число гостей, что сказывается на низкой эффективности мероприятия как маркетингового инструмента.

-1

HappyGroundhog 13 часов назад

Увлекательная криптография. Часть 1

Средний

7 мин

2.2K

Информационная безопасность *Криптография *CTF *

Туториал

Как и многие специалисты по ИБ, я очень люблю разминать мозг различными головоломками. Идеальным для меня является формат CTF, позволяющий проверить свои знания и толику нестандартного мышления на различных типах задач.

Сегодня я хочу рассказать о первой из трёх задач из категории Crypto с прошлогоднего CTF HTB «Cyber Apocalypse». Задачи на криптографию моя отдельная любовь, поскольку позволяют нетрадиционно взглянуть как на привычные криптографические алгоритмы, так и на неудачные попытки их использования. Особенно интересно искать уязвимость в самописных алгоритмах. Последнее наиболее опасно в реальной жизни, поскольку некоторые разработчики уверены, что уж они то смогут как минимум правильно реализовать известный алгоритм, а не тянуть за собой OpenSSL. Некоторые даже стараются написать свой собственный алгоритм и тем самым обеспечить надежную защиту данных! Множество CTF задач разной сложности обычно позволяют быстро развенчать этот миф :-)

+11

yudeek 13 часов назад

Есть ли польза от GoF-паттернов?

Простой

5 мин

2.3K

Программирование *

Обзор

Паттерны проектирования стали неотъемлемой частью минимального набора знаний современного разработчика. Их упоминание вы с легкостью найдете в описании вакансии как на фронта, так и на бэка. На техническом интервью вам обязательно зададут вопрос о паттернах, а на утреннем созвоне с командой нередко прозвучит что-то типа адаптер, фабрика или обсервер. Хотя последнее, возможно, слегка притянуто за уши. Бесспорно, паттерны проектирования - это очередная тема, о которой говорят все, но о доказанной эффективности которых известно достаточно мало деталей.

natalia_yakovleva 15 часов назад

Автоматизация тестирования против ручного тестирования: Заменит ли автоматизация ручных QA специалистов?

Простой

12 мин

669

Тестирование IT-систем *

Из песочницы

Перевод

Тестирование программного обеспечения можно разделить на различные категории по разным параметрам. Однако наиболее распространенным является разделение на ручное и автоматизированное тестирование.

Тестирование программного обеспечения - одна из наиболее быстро развивающихся отраслей высоких технологий. Рынок тестирования программного обеспечения оценивался в 40 млрд долларов США в 2021 году, а ожидаемые темпы роста в период с 2022 по 2030 год составят 6%. Важность обеспечения качества в сфере программного обеспечения не подлежит обсуждению, что снова и снова доказывают, казалось бы, многообещающие решения, которые в конечном итоге терпят неудачу из-за отсутствия тестирования.

Традиционно тестирование программного обеспечения можно разделить на различные категории по разным параметрам. Однако наиболее распространенным является разделение на ручное и автоматизированное тестирование. Но в чем разница между автоматизированным и ручным тестированием? Когда следует выбирать автоматизированное тестирование, а когда ручное? И заменяет ли автоматизация ручное тестирование? Именно об этом мы и поговорим сегодня.

TLHE 15 часов назад

Моделирование лесных пожаров: теория, клеточный автомат на Python

Средний

10 мин

1.3K

Python *Алгоритмы *Читальный зал Научно-популярное Экология

Обзор

Перевод

Математические модели распространения огня являются важной частью борьбы с пожарами. Модели могут помочь определить, где может начаться пожар, как быстро он будет распространяться (и в каком направлении), и сколько тепла он будет выделять. Эти важные подсказки могут спасти жизни и существенно сократить финансовые потери.

Очень идеализированный лесной пожар может быть представлен с помощью простого клеточного автомата.

+12

2 3 ...

49 50

Все потоки

Как сисадмин из Ульяновска попал в Кремниевую долину. Такая ли большая разница?

Новости

NGINX подготовил бинарники для предварительной версии реализации QUIC+HTTP/3

Пошаговая отладка, inline-методы, JVM

Почему Chat GPT говорит по-русски с нейронным акцентом? Специфика токенизации кириллицы нейронной сетью от Open AI

Обзор портативных газоанализаторов для измерения концентрации горючих и токсичных газов

Самый простой пример CI/CD

filebump — хостинг файлов по API

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

Как я завалил первый тех. собес на позицию Junior QA Engineer

Музыкальные инструменты, клюшки для гольфа, PS2 и много Nintendo: новые покупки на испанской барахолке

Как недетерминированная GPT может выдавать четкие ответы

Delayed durability поможет вашему ORM увеличить производительность на 50% и более, если Вы только будете использовать …

Chrome Headless против cloudflare JS challenge

Как подключить ИИ-ассистента* на технологии OpenAI к мессенджерам* на вашем смартфоне**** (кликбейт)

Истории

Кластер ElasticSearch на 1Ptb+

Как эффективно продвигать ивенты в digital?

Увлекательная криптография. Часть 1

Есть ли польза от GoF-паттернов?

Автоматизация тестирования против ручного тестирования: Заменит ли автоматизация ручных QA специалистов?

Моделирование лесных пожаров: теория, клеточный автомат на Python

Лучшие блоги