Как стать автором

Семантика *

Веб 3.0

Статьи Посты Новости Авторы Компании

ldrbmrtv 27 фев в 12:56

Open Research Knowledge Graph: новый подход к научной коммуникации

Средний

3 мин

864

Семантика *Открытые данные *Научно-популярное

Обзор

На сегодняшний день для представления и обмена результатами исследований мы используем методы, которые были разработаны много веков назад. С момента зарождения современной науки (публикации первого научного журнала "Transactions of the Royal Philosophical Society", 1665 г.) мы используем все тот же метод передачи научных знаний – статьи. Немецкая национальная научно-техническая библиотека TIB и исследовательский центр L3S при Университете Лейбница в Ганновере изобретают новый подход к научной коммуникации. Вместо того чтобы представлять исследования в виде статичных PDF файлов, они работают над динамическим графом знаний - Open Research Knowledge Graph, где научные идеи, подходы и методы представлены в структурированном машиночитаемом формате.

Читать далее

+8

itGuevara 24 фев в 00:01

Semantic BPM. Семантика и синтаксис бизнес-процессов

Средний

26 мин

2.1K

Семантика *Анализ и проектирование систем *IT-стандарты *Визуализация данных *Подготовка технической документации *

Онтологический инжиниринг в области Управления бизнес-процессами (BPM). Семантический BPM (Business Process Management), впрочем, как и семантический ЕА (Enterprise Architecture), – это заимствование концепций (подходов к описанию и онтологизации) \ инструментов Linked Data к указанным направлениям (формализация процессов и архитектур предприятий).

«Красная нить»: когда мы формализуем процессы - мы говорим об одном и том же, но на разных языках (нотациях), поэтому стандартизация Языка семантики, онтологических концептов BPM (EA) – важная, но еще недостаточно популяризированная составляющая развития BPM (следующий этап, ВРМ 3.0). Отделение («мух от котлет») семантики от синтаксиса позволит «рафинировать» понятийный (смысловой) анализ бизнес-процессов и при их аналитике оперировать базовыми (семантическими) концептами (образами).

В Semantic BPM, как и в Semantic Web (семантическая паутина), смысл представленного процесса \ архитектуры понятен не только человеку, но и машинам и они могут его читать и обрабатывать. Эти смыслы, обычно передаваемые «человек – человек» на языке синтаксиса / графической грамматики через нотации VAD, EPC, BPMN, UML (плюс еще несколько десятков подобных вариантов \ форматов «обертывания», включая Дракон), исходно формализуются на языке семантики (стек Linked Data или аналогичный) и уже потом упаковываются в схемы с конкретной нотацией («пишутся» на языке какой-либо нотации). Для единого понимания смысловой составляющей схем применяется общая ВРМ-онтология, толковый словарь ВРМ.

Читать далее

+5

SergeyBPshenichnikov 24 янв в 05:38

Алгебра смысла

Средний

12 мин

3.8K

Семантика *Математика *Искусственный интеллект Natural Language Processing *

FAQ

Пшеничников С.Б.

Знаковые последовательности (например, вербальные и нотные тексты) можно превратить в математические объекты. Слова и числа стали одной сущностью, представлением матричной единицы, которая является матричным обобщением целых чисел и гиперкомплексным числом. Матричная единица — это матрица в которой один элемент равен единице, а остальные — нули.

Если слова текста представить такими матрицами, то конкатенация (объединение с сохранением порядка) слов и текстов становится операцией сложения матриц.

С текстами можно совершать преобразования с помощью алгебраических операций, например делить с остатком один текст на другой. Математически распознавать смысл текста и вычислять контекст слов. При этом алгебра помогает интерпретировать все промежуточные этапы вычислений.

Человек видит и слышит только то, что понимает (И. В. Гёте). Понимает то, чему придает смысл как значимости для него. Смысл субъективен и зависит от интересов, мотиваций и чувств.

Л. С. Выготский различал понятия «смысл» и «значение»: «если „значение“ слова является объективным отражением системы связей и отношений, то „смысл“ — это привнесение субъективных аспектов значения соответственно данному моменту и ситуации».

По Г. Фреге «значения» — это свойства, отношения объектов, «смысл» — это только часть этих свойств. При этом и «значения» и «смысл» именуются одним «знаком», например словом. Два человека могут из списка значений выбрать для одного слова два непересекающихся фрагмента (два смысла) для его толкования.

Читать далее

+2

TSjB 18 янв в 21:32

Семантический поиск и генерация текста на R. Часть 2

Средний

5 мин

889

Поисковые технологии *Семантика *R *Машинное обучение *Natural Language Processing *

В первой части говорили про использование поиска и генерации ответа с помощью языковых моделей. В этой части рассмотрим память и агентов.

Читать далее

+3

TSjB 12 янв в 18:41

Семантический поиск и генерация текста на R. Часть 1

Средний

10 мин

2K

Поисковые технологии *Семантика *R *Машинное обучение *Natural Language Processing *

Из песочницы

Для этой задачи использую LLM (Large Language Models - например, chatGPT или opensouce модели) для внутренних задач (а-ля поиск или вопрос-ответную систему по необходимым данным).

Я пишу на языке R и также увлекаюсь NLP (надеюсь, я не один такой). Но есть сложности из-за того, что основной язык для LLM - это python. Соответственно, на R мало примеров и документации, поэтому приходится больше времени тратить, чтобы “переводить” с питона, но с другой стороны прокачиваюсь от этого.

Чтобы не городить свою инфраструктуру, есть уже готовые решения, чтобы быстро и удобно подключить и использовать. Это LangChain и LlamaIndex. Я обычно использую LangChain (дальше он и будет использоваться). Не могу сказать, что лучше, просто так повелось, что использую первое. Они написаны на питоне, но с помощью библиотеки reticulate всё работает и на R.

Читать далее

+8

Libiros 23 дек 2023 в 11:32

<dl> или <table>? Исследуем подходы к представлению пар ключ-значение в HTML

Простой

5 мин

2.9K

Семантика *HTML *Accessibility *

Туториал

Казалось бы, простая задача - сверстать список пар ключ-значение. Бери <div> и делай. Но что, если захотелось подушнить? Этим и займёмся в статье...
Рассмотрим три подхода к решению этой задачи: <div>, <dl>, <dt>, и <dd>, и <table>. Обсудим преимущества, недостатки и примеры.
Цель - помочь выбрать наиболее подходящий подход для конкретной задачи.

Читать далее

+11

AntiLogik 19 дек 2023 в 16:18

На чем основана логика? Часть 2. Математическая модель полисиллогистики

Средний

14 мин

2.3K

Семантика *Алгоритмы *Математика *Научно-популярное

Аналитика

В первой части было рассказано об алгебре множеств, рассматриваемой в качестве оснований классической логики и показано, как можно обосновать без аксиом законы алгебры множеств, которые полностью соответствуют законам классической логики.

В Части 2 будут показаны недостатки и некорректности силлогистики, а также рассмотрена новая, основанная на законах алгебры множеств, математическая модель полисиллогистики, в которую добавлены новые методы логического анализа, включающие распознавание ошибок в рассуждении и методы получения абдуктивных заключений.

Читать далее

+3

AntiLogik 19 дек 2023 в 15:48

На чем основана логика? Часть 1. Алгебра множеств без аксиом

Средний

9 мин

6.1K

Семантика *Алгоритмы *Математика *Научно-популярное

Аналитика

Сразу начну с гипотезы, положенной в основу данной статьи: вся классическая логика основана на множествах, точнее, на алгебре множеств. Должен сказать, что в современной логике и математике эта гипотеза считается ошибочной, так как еще на рубеже XIX и XX столетий сложилось убеждение (точнее, заблуждение), что понятие «множество» противоречиво. Мне представляется, что настала пора избавляться от этого и некоторых других заблуждений, связанных с логикой.

Читать далее

+3

ksotar 8 дек 2023 в 08:04

Свежий Google Gemini, GPT-4 и математика

Средний

10 мин

23K

Семантика *Математика *Машинное обучение *Искусственный интеллект Natural Language Processing *

Обзор

Итак, Google всё‑таки решилась выпустить в свет языковую модель Gemini не дожидаясь Нового Года, и, конечно, обещая революцию. Она де превосходит все публично доступные модели, и местами превосходит людей. Отдельной её особенностью является мультимодальность (в частности способность работать с изображениями и видео) в почти реалтайм режиме, чему есть довольно впечатляющие демонстрации.

Давайте же сравним её с флагманом OpenAI/Microsoft — GPT-4, на трудном поле математики.

Читать далее

+26

muxa_ru 27 ноя 2023 в 03:08

Реальность существует и это надо учитывать

11 мин

27K

Семантика *Машинное обучение *Исследования и прогнозы в IT *

Мнение

✏️ Технотекст 2023

Я полгода собирался написать эту статью и одной из причин постоянного откладывания её написания было то, что я не знал как её начать. Поэтому, начну банально.

Привет, меня зовут Михаил Елисейкин, я более 20 лет в IT, более 20 лет изучаю историю техники, и сейчас хочу сказать, что эти два профессиональных сообщества объединяю не только я, но и общая распространённая проблема - игнорирование реальности.

Это и в самом деле именно так: имея данные о статистике производства, материалах на входе, продукции на выходе, бухгалтерской отчётности и т.д., и историк и айтишник делают одно и то же - создают модель предприятия как производственного процесса:

Читать далее

+12

Exilon 16 ноя 2023 в 01:30

Алгебра совокупностей Брусенцова и не только

Средний

39 мин

5.7K

Семантика *Математика *Профессиональная литература *История IT

Из песочницы

Все, кто когда-либо интересовались трёхзначной логикой, троичной системой счисления или архитектурой троичных компьютеров, рано или поздно натыкались на труды Брусенцова Николая Петровича, в особенности 3 его самые известные книги:

1) Брусенцов Н.П. Начала информатики, 1994.

2) Брусенцов Н.П. Искусство достоверного рассуждения. Неформальная реконструкция аристотелевой силогистики и булевой математики мысли, 1998.

3) Брусенцов Н.П. Блуждание в трёх соснах (Приключения диалектики в информатике), 2000.

Для тех, кто не в курсе, Брусенцов Николай Петрович - главный конструктор первой в мире и Советском Союзе троичной ЭВМ "Сетунь". Об этом хорошем человеке можно найти достаточно много информации в открытых источниках. Но сейчас речь не о нём, а о разработанной им алгебре совокупностей (алгебре дизъюнктов), которая фигурирует в качестве фундамента во всех 3-х упомянутых выше книгах. К слову сказать, сами книги не являются учебниками по чистой математике или информатике. Они освещают проблемы злоупотребления формализмом в современной математической логике, а также содержат пути к возрождению и развитию аристотелевой силогистики. Мотивацией к написанию данной статьи послужило то, что каждую книгу пришлось прочитать раза по три, прежде чем в голове сложилась более или менее цельная картина. Этому также поспособствовало обилие терминологии, более присущей философским трактатам, нежели учебникам по математике. Поэтому цель данной статьи - получить представление об этой алгебре и облегчить чтение вышеуказанных книг. Статья носит обзорный характер, знакомит читателя с некоторыми понятиями (акценты расставлены жирным шрифтом) и пытается ответить на вопросы, неосвещённые в книгах явно.

Читать далее

+22

Saitcraft77 7 ноя 2023 в 12:23

ТОП-5 антисоветов для владельцев бизнеса, которые не хотят зарабатывать деньги

Простой

4 мин

1.6K

Семантика *Клиентская оптимизация *Интернет-маркетинг *Контекстная реклама *Поисковая оптимизация *

Recovery Mode

Мы с ребятами в агентстве уверены: чтобы брать — нужно отдавать. А вот некоторые клиенты считают наоборот. Поэтому, исходя из собственного опыта, мы решили поделиться советами, которым следовать не нужно. Разумеется, если вы хотите расти в прибыли.

Читать далее

-2

Saitcraft77 30 окт 2023 в 15:26

Как с помощью Мастера кампаний при сокращении бюджета уменьшить стоимость лида из Директа с 2500 до 344 р?

3 мин

1.7K

Семантика *Контекстная реклама *Повышение конверсии *Поисковая оптимизация *

Recovery Mode

Я и мои коллеги в агентстве стабильно приводили производителю трубопроводной запорной арматуры лиды по 600–800 р. Клиента всё устраивало. Внезапно стоимость увеличилась до 2500 р. «Немыслимо» —подумали мы. «Невозможно» — ответил клиент. Делать нечего: стали разбираться, почему так произошло, и как это быстро исправить. Вот что из этого вышло…

Читать далее

-4

Saitcraft77 23 окт 2023 в 09:24

Фрилансеры vs агентство: как не угробить SEO и сразу сделать все правильно?

Средний

7 мин

1.1K

Семантика *Интернет-маркетинг *Контекстная реклама *Поисковая оптимизация *

Recovery Mode

Тренд последних лет ‒ обращение к SEO-специалистам, которые работают на фрилансе, а не в агентстве. Но так ли это безопасно, и не придется ли платить дважды? Ко мне в агентство обратился клиент, который бежал со всех ног от такого SEO-фрилансера. Давайте объясню подробнее…

Читать далее

-5

PPR 17 окт 2023 в 10:47

Алгоритм поиска ключевых словосочетаний «на пальцах». Анализируем новости

Средний

5 мин

3K

Блог компании Программный Продукт Python *Семантика *Алгоритмы *Natural Language Processing *

Туториал

В современном мире объем данных в интернете постоянно растет с огромной скоростью. Возникает логичный вопрос: как ориентироваться в этом информационном потоке?

Чтобы упростить себе задачу поиска и обобщения информации IT-энтузиасты применяют технологии генеративно обученных чат-ботов. Наиболее широкое распространение получил ChatGPT. Яндекс, в свою очередь, добавил в браузер YandexGPT, который позволяет тезисно ознакомиться с содержанием страницы. Всё чаще вакансия Prompt-инженера начинает встречаться на hh и Хабр Карьере. Специалисты и чат-боты помогают конечному пользователю экономить время для поиска необходимой информации.

Но что делать, если возможности обратиться за помощью к подобным технологиям нет? Указанные выше языковые модели нельзя интегрировать в собственные проекты, сценариев их использования много, но они всё равно ограничены.

В статье мы расскажем, как (не без нейронных сетей) можно создать простой алгоритм на Python, который поможет извлекать ключевые слова из любого текста, тем самым избавляться от ненужной информации и автоматизировать процесс анализа материалов. Мы будем работать с русским текстом, а именно — с новостными постами. Поэтому в частном случае используются пакеты для обработки, поддерживающие именно русский язык. В том числе используются модели, обученные на корпусах текстов с новостной семантикой.

Читать далее

+1

Saitcraft77 5 окт 2023 в 13:09

Какие результаты можно получить от SEO на примере реальных клиентов?

Простой

6 мин

1.5K

Семантика *Клиентская оптимизация *Интернет-маркетинг *Контекстная реклама *Поисковая оптимизация *

Recovery Mode

«Не могу решиться на SEO, вера не позволяет. А если серьезно, то специалисты закидывают меня какими-то обещаниями и сроками в 3 месяца. Ничего не понятно: что я получу, зачем столько ждать?». Лично я слышал и такие истории. Решить их можно, но нужно знать как. Давайте разбираться.

Читать далее

-4

AntiLogik 24 сен 2023 в 16:21

Приложения алгебры кортежей. Часть 2. Математическая модель вопроса

Средний

11 мин

1.9K

Семантика *Алгоритмы *ООП *Математика *Сжатие данных *

Мнение

В предыдущей части рассматривалась новая система счисления, в обосновании которой использовались некоторые соотношения алгебры кортежей.

Об алгебре кортежей (АК) и ее использовании для логико-семантического анализа было рассказано в моей статье в Хабре. В комментариях к статье предлагалось обратить внимание на функцию SELECT в языке SQL, которая соответствует операции Selection (Выборка) в реляционной алгебре. Эта операцию можно рассматривать как один из вариантов математической модели вопроса.

Предлагаемый здесь вариант смысла вопроса заключается в том, что в вопросе заданы некоторые ограничения (область знания, ситуация, значения некоторых атрибутов и т.д.), которые требуется использовать для того, чтобы найти или вычислить значение определенного атрибута или проверить правильность заданных в вопросе соотношений. Эта семантика применима к восполняющим вопросам типа «Что?», «Где?», «Когда?», к уточняющим вопросам типа «Верно ли, что А?» и к ИЛИ-вопросам типа «Что правильно: А или Б?». Назовем такие вопросы ограничительными. Их можно считать вариантами известной в искусственном интеллекте задачи удовлетворения ограничений.

Читать далее

+2

pavlusha311245 14 сен 2023 в 14:37

Как рассказать о сайте поисковой системе

Простой

5 мин

3.7K

Веб-разработка *Семантика *Поисковая оптимизация *

Туториал

Сайт написан, домен куплен, так почему же я до сих пор не вижу его в Google/Yandex?

В этой статье Вы узнаете как поисковые системы определяют ваш сайт и как же его добавить в поиск.

Читать далее

+4

m1llark 12 сен 2023 в 12:23

Разница между Data Race и Race Condition

Простой

3 мин

8.3K

Семантика *Java *Совершенный код *Параллельное программирование *

Из песочницы

Рассмотрим разницу между популярными ошибками при работе с многопоточностью, такими как Data Race и Race Condition, а также способами борьбы с ними.

Читать далее

+3

ewolf 24 авг 2023 в 12:00

Семантики доставки событий в распределенных системах

9 мин

7.2K

Блог компании AvitoTech Высокая производительность *Семантика *Программирование *

Павел Агалецкий, ведущий разработчик в юните Platform as a Service в Авито, рассказал про семантики или гарантии доставки сообщений, и почему с ними не всегда просто разобраться.

Читать далее

+14

1