Как стать автором
Обновить
-3

Семантика *

Веб 3.0

Сначала показывать
Порог рейтинга
Уровень сложности

Автоматы и разумное поведение. Основные положения концепции (подхода) Н.М. Амосова

Время на прочтение121 мин
Количество просмотров6.9K



В продолжении одной из тем, поднятых в публикации Александра Ершова (Ustas) «Нейросетевой визуальный поиск», предлагаю читателям Хабра погрузиться в мир концепции Н.М. Амосова, ее $i$-моделей, М-сетей и автоматов. Как я надеюсь, именно они — наиболее вероятные кандидаты на роль «серебряной пули», которая позволит энтузиастам «сильного интеллекта» или, в другой терминологии, «искусственного разума» приблизиться к пониманию путей его реализации.


В данной статье автор попытался предельно сжато (конспективно) изложить основные положения концепции Николая Михайловича Амосова. Этот подход достаточно детально изложен в коллективной монографии «Автоматы и разумное поведение. Опыт моделирования», авторами которой был Н.М. Амосов и его соратники: A.M. Касаткин, Л.М. Касаткина и С.А. Талаев. Могу сказать, что это единственная монография, из всех работ по теме «искусственного разума», с которыми я смог познакомиться до сегодняшнего дня, содержащая ясное, обстоятельное, всестороннее, систематическое и в тоже время убедительное, а, в отдельных местах — даже высокохудожественное (говорю это без малейшей доли иронии) — изложение теоретических основ авторской концепции «искусственного разума», а также полученных на ее основе экспериментальных результатов.


Обращаюсь ко всем, у кого есть задор, жгучий интерес к теме «искусственного разума», а также желание поближе познакомиться с подходом Н.М. Амосова — читайте дальше...

Читать дальше →
Всего голосов 10: ↑7 и ↓3+7
Комментарии191

Проектируем мульти-парадигменный язык программирования. Часть 3 — Обзор языков представления знаний

Время на прочтение17 мин
Количество просмотров5.7K
Продолжаем рассказ о создании мульти-парадигменного языка программирования, поддерживающего декларативный логический стиль для описания модели предметной области. Прошлые публикации находятся здесь и здесь. Теперь пришло время для описания основных особенностей и требований к языку описания модели предметной области. Но для начала сделаем небольшой обзор наиболее популярных языков представления знаний. Это довольно обширная область, имеющая давнюю историю и включающая ряд направлений — логическое программирование, реляционное исчисление, технологии семантической паутины, фреймовые языки. Я хочу сравнить такие языки как Prolog, SQL, RDF, SPARQL, OWL и Flora, выделить те их особенности, которые были бы полезны в проектируемом мульти-парадигменном языке программирования.
Читать дальше →
Всего голосов 7: ↑7 и ↓0+7
Комментарии5

Алгоритм Jerdella: решаем проблемы семантического безумия в IT-системах банков

Время на прочтение15 мин
Количество просмотров4.3K
Семантические проблемы в IT системах. Что бывает, когда много разных людей начинают творить

Есть ветхозаветная легенда о том, как люди в древнем городе Вавилон начали строить башню, но Всевышний перемешал им языки, и башня достроена не была. Еще бы, ведь башню строили сотни маленьких групп, которые в совокупности не понимали друг друга. А не понимая друг друга, невозможно взаимодействовать. Действительно, просто безумие – называть одну и туже вещь, подразумевая её одинаково, разными словами. И удивительного тут ничего нет.

Ветхозаветную легенду можно с легкостью перенести на современные крупные компании, внедряющие современные ИТ-решения. В пример таких компаний, вне всякого сомнения, можно отнести современные российкие банки, которые имеют десятки, а то и сотни бизнес-подразделений, в которых складывается своя субкультура общения, построенная на своих правилах и уникальном стиле делового оборота. Естественно, при формировании ИТ-инфрастурктуры учитывается устоявшийся в коллективе стиль именования бизнес-сущностей. За последние десять лет появилось множество работ на эту тему, например эта [1]. Те, кто сталкивался с аналитикой информационных систем в банках знают, что такое сделать так называемый «маппинг» данных, особенно, если конечные системы делали разные команды аналитиков, разработчиков и заказчиков или вендоров. Как правило, на 60% составление маппинга является уяснением сути и семантики передаваемых данных.

Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии61

Проектируем мульти-парадигменный язык программирования. Часть 2 — Сравнение построения моделей в PL/SQL, LINQ и GraphQL

Время на прочтение11 мин
Количество просмотров3.4K
В прошлой публикации я поднял вопрос о том, что бизнес-логика современных информационных систем включает в себя достаточно много элементов, описания которых по своей природе декларативны: структура понятий, отношения между ними, условия, правила, трансформация понятий при переходе от одних слоев приложения к другим, их объединение, фильтрация, агрегация и т. п. С моей точки зрения функциональный и объектно-ориентированный стили уступают логическому в плане удобства программной реализации модели предметной области. Логический стиль передает отношения между понятиями более компактно и естественно. Поэтому я поставил себе цель создать гибридный язык программирования, который совмещал бы объектно-ориентированную или функциональную парадигму с логической. Причем логическая компонента должна быть удобной для описания модели предметной области — структуры ее понятий, а также отношений и зависимостей между ними.

В этой публикации я хочу поговорить о некоторых популярных языках и технологиях, включающих элементы декларативного программирования — PL/SQL, MS LINQ и GraphQL. Попытаюсь разобраться, какие задачи в них решаются с помощью декларативного программирования, насколько тесно переплетены декларативный и императивный подходы, какие это дает преимущества, и какие идеи можно из них почерпнуть.
Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии2

Истории

Проектируем мульти-парадигменный язык программирования. Часть 1 — Для чего он нужен?

Время на прочтение13 мин
Количество просмотров4.1K
Хабр это замечательное место, где можно смело делиться своими идеями (даже если они и выглядят безумно). Хабр видел много самодельных языков программирования, расскажу и я о своих экспериментах в этой области. Но мой рассказ будет отличаться от остальных. Во-первых, это будет не просто язык программирования, а гибридный язык, сочетающий в себе несколько парадигм программирования. Во-вторых, одна из парадигм будет довольно необычной — она будет предназначена для декларативного описания модели предметной области. А в-третьих, сочетание в одном языке декларативных средств моделирования и традиционных объектно-ориентированного или функционального подходов способно породить новый оригинальный стиль программирования — онтологически-ориентированное программирование. Я планирую раскрыть в первую очередь теоретические проблемы и вопросы, с которыми я столкнулся, и рассказать не только о результате, но и о процессе создания дизайна такого языка. Будет много обзоров технологий и научных подходов, а также философских рассуждений. Материала очень много, придется разбить его на целую серию статей. Если вас заинтересовала такая масштабная и сложная задача, приготовьтесь к долгому чтению и погружению в мир компьютерной логики и гибридных языков программирования.
Читать дальше →
Всего голосов 4: ↑2 и ↓2+2
Комментарии34

Ищем «Троллей». Алгоритм шинглов & косинусное сходство

Время на прочтение14 мин
Количество просмотров5.1K

Думаю, многие в напряженных дискуссиях в интернете сталкивались с обвинением людей в том, что они боты, тролли и проплачены Кремлем, Киевом или Вашингтоном. Но как действительно выявить таковых или просто людей пытающихся активно донести своё мнение до остальных?
Читать дальше →
Всего голосов 11: ↑10 и ↓1+17
Комментарии5

Некоторые спорные размышления над работой Г. Фреге «Смысл и денотат»

Время на прочтение35 мин
Количество просмотров7.3K
Термины «значение» (meaning) и «выражать» не были введены в качестве основных терминов семиотики в связи с тем, что они настолько многозначны и используются настолько по-разному, что лучше было бы вообще не использовать их в качестве основных терминов при обсуждении семиотических проблем. Но при желании их, разумеется, можно ввести, опираясь на более фундаментальные семиотические термины. Так, можно было бы сказать, что значение знака – это его значение-сигнификация и интерпретанта одновременно, но ни одно из них в отдельности.

Моррис Ч.У. «Значение и означивание»

В этом небольшом эссе я хочу поделиться с читателем своими размышлениями, возникшими при прочтении работы Г. Фреге «Смысл и денотат» [1].


Слабонервных прошу не читать статью (да к тому же написанную 9 лет назад)!

Читать дальше →
Всего голосов 2: ↑2 и ↓0+2
Комментарии47

Анализ тональности в русскоязычных текстах, часть 1: введение

Время на прочтение13 мин
Количество просмотров18K
image
Анализ тональности стал мощным инструментом для масштабной обработки мнений, выражаемых в любых текстовых источниках. Практическое применение этого инструмента в английском языке довольно развито, чего не скажешь о русском. В этой серии статей мы рассмотрим, как и для каких целей применялись подходы анализа тональности для русскоязычных текстов, какие результаты удалось достичь, какие проблемы возникали, а также немного поговорим о перспективных направлениях. В отличие от предыдущих работ, я сосредоточился на прикладном применении, а не на самих подходах и их качестве классификации. Первая часть — вводная. Мы рассмотрим, что такое «анализ тональности», какой он бывает и как его за последние 8 лет применяли для анализа русскоязычных текстов. Во второй части детально рассмотрим каждое из 32 основных исследований, которые мне удалось найти. В третьей и заключительной части поговорим об общих сложностях, с которыми сталкивались исследователи, а также о перспективных направлениях на будущее.
Читать дальше →
Всего голосов 31: ↑31 и ↓0+31
Комментарии0

Довольно непонятное решение в schema.org с LocalBusiness

Время на прочтение1 мин
Количество просмотров1.7K

Описание, для чего проект schema.org можно найти здесь — https://schema.org. На хабре это редкий гость, для него даже специального хаба не было.


Я знаю, что Яндекс пытался пользоваться schema.org… Они этой частью, видимо, не пользуются.


Отношения


https://schema.org/Library, https://schema.org/ExerciseGym — оба относят себя к https://schema.org/LocalBusiness.


LocalBusiness относит себя сразу к двум объектам (именно здесь и есть особенность schema.org): https://schema.org/Organization и https://schema.org/Place


Словари


https://www.oxfordlearnersdictionaries.com/definition/english/gym?q=Gym (один смысл — место, другой — организация)
https://dictionary.cambridge.org/us/dictionary/english/gym (один смысл использует неоднозначное слово "club", другой про место)


Проверку словарями можно и завалить, но я не вижу оснований для этого...

Всего голосов 12: ↑3 и ↓9-3
Комментарии4

Деятельность, документы и семантика

Время на прочтение4 мин
Количество просмотров1.6K
На данный момент современные информационные системы моделирующие деятельность и системы документооборота, юридически обеспечивающие деятельность, разнесены по разным архитектурным уровням, взаимодействующим только по линии контроля и учета. Электронный документооборот с использованием ЭП не решает проблему разрыва между двумя этими уровнями, обеспечивая лишь скорость и защищенность обмена документами.
Читать дальше →
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Частное расследование SEO бага на сайте Монобанка

Время на прочтение8 мин
Количество просмотров4.2K

По сути это история розыска дефекта вёрстки банковского сайта, приведшего к неточному отображению его главной страницы на поиске. Подобную проблему часто встречают на сайте, собранном например в онлайновом конструкторе, или свёрстанном например верстальщиком не знакомым с азами поисковой оптимизации.

И эта история так и осталась бы интересной лишь узкому кругу практикующих сеошников, не коснись она одной недокументированной особенности индексации, о которой наверняка захотелось бы узнать и прочим специалистам по обслуживанию сайта. Приглашаю их под кат.
Читать дальше →
Всего голосов 8: ↑6 и ↓2+9
Комментарии11

Для тех, кто покупает ссылки

Время на прочтение7 мин
Количество просмотров23K
Статья не про «работают или не работаю ссылки», а для тех, кто занимается их покупкой или хочет самостоятельно начать это делать. В ней я дам некоторые рекомендации, опираясь на свой опыт по ссылочным биржам. На рассмотрение возьмем трех представителей.

Общее правило — если вы не хотите бесплатно ссылку на этом сайте — не покупайте.

1. trastik.com


Хочу более подробно написать о данной площадке, поскольку узнал о ней не так давно (ранее просто не было нужны в доп. биржах). Распишу без воды, основные плюсы, минусы и личные рекомендации.

Плюсы


1. Хорошая цена на ссылки. Если на GGL, Miralinks и PR-SAPE ценник на «нормальную» ссылку начинается от 500 р., здесь можно получить аналогичного донора за 150-200 р. Лично я приобрел за 1000 р. ссылку на домен с трафиком 1кк уникумов в месяц. Очень достойная цена. Проверьте стоимость на других сервисах — очень удивитесь :).
Читать дальше →
Всего голосов 15: ↑4 и ↓11-4
Комментарии4

Самоучитель клингонского

Время на прочтение9 мин
Количество просмотров13K

Пару лет назад мы рассказали о том, как в системе Антиплагиат устроен поиск русского перевода английских статей. Естественно, без машинного переводчика в алгоритме не обойтись. В основе машинного переводчика, конечно, лежит машинное обучение, которое, в свою очередь, требует весьма значительного количества «параллельных предложений», т.е. одинаковых по смыслу предложений, написанных на двух языках. Значительное количество — это миллионы предложений, и чем больше, тем лучше. Понятно, что для русско-английской пары найти такую базу (в том числе и в открытом доступе) реально. А что делать с теми языковыми парами, для которых параллельных предложений принципиально не может быть слишком много?


Казалось бы, не имея в распоряжении большого объема обучающих примеров, обучить систему машинного перевода невозможно. Но на помощь приходит идеология Unsupervised Learning, или «обучение без учителя». Ну а чтобы задача была действительно интересной (особенно порадует она фанатов вселенной Стартрека), мы будем обучать наш машинный переводчик для пары языков «английский – клингонский».


Источник картинки: Собственное творчество от команды Антиплагиата


А самым подходящим девизом к дальнейшему рассказу о применении Unsupervised Learning будет знаменитая выдержка из Инструкции клингонского почетного караула «Если не можешь контролировать себя, тебе не дано командовать другими».


bISeH'eghlaH'be'chugh latlh Dara'laH'be'
Всего голосов 12: ↑12 и ↓0+12
Комментарии0

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
14 сентября
Конференция Practical ML Conf
МоскваОнлайн
19 сентября
CDI Conf 2024
Москва
20 – 22 сентября
BCI Hack Moscow
Москва
24 сентября
Конференция Fin.Bot 2024
МоскваОнлайн
25 сентября
Конференция Yandex Scale 2024
МоскваОнлайн
28 – 29 сентября
Конференция E-CODE
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
30 сентября – 1 октября
Конференция фронтенд-разработчиков FrontendConf 2024
МоскваОнлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн

Семантика и деятельность

Время на прочтение3 мин
Количество просмотров3K
В тексте “Семантические цифровые системы” отмечалось, что современные семантические технологии пока не имеют полноценных инструментов для описания деятельности. Семантические данные традиционно представляются в виде объектного графа, узлами которого являются сущности или значения, а ребрами — свойства (отношения и атрибуты). Такие графы фиксируют статичное состояние предметной области. И такой одномоментно схваченный набор данных скорее следует рассматривать как граф знаний о предметной области, а не как ее модель, особенно если предметная область является деятельностью, а не набором неизменных фактов.
Читать дальше →
Всего голосов 8: ↑7 и ↓1+9
Комментарии6

Семантические цифровые системы

Время на прочтение4 мин
Количество просмотров4.1K
В предыдущем тексте (Мифы семантической технологии) не без доли эпатажа утверждалось, что в айтишной семантике нет никакой семантики. Хотя, конечно, надо отдельно отвечать на два вопроса: (1) содержат ли данные смысл? и (2) понимает ли этот смысл компьютер? Второй вопрос оставим философам, хотя ответ на него и так очевиден. Как очевиден и ответ на первый: информационные системы для того и нужны, чтобы обрабатывать информацию, то есть осмысленные, семантически определенные данные. При этом, конечно, надо понимать, что осмысленными эти данные являются только для человека, который исходно продуцирует эти данные, пишет программу для их обработки и в конечном счете воспринимает их смысл.
Читать дальше →
Всего голосов 8: ↑5 и ↓3+5
Комментарии0

Мифы семантической технологии

Время на прочтение4 мин
Количество просмотров3.7K
В предыдущем тексте “Миф семантического веба” была сделана попытка обосновать мысль, что семантический веб в рамках исходно предложенных его основателями технологических решений так и останется мечтой. Хотя сами семантические инструменты от W3C не без скрипа, с доводкой напильником, но вполне успешно применяются для моделирования онтологий в энтерпрайз-проектах.

Сейчас же попробуем разобраться с мифами, которые можно услышать при обсуждении семантического подхода даже от профессионалов.
Читать дальше →
Всего голосов 12: ↑9 и ↓3+14
Комментарии28

Миф семантического веба

Время на прочтение5 мин
Количество просмотров10K
В сфере семантического моделирования сложилась довольно странная ситуация: в качестве базовых используется набор стандартов и спецификаций от W3C, заточенных под проект “семантического веба” (RDF/OWL, SPARQL и пр.), хотя сам проект не только не реализован на данный момент, но и, по всей видимости, никогда не будет воплощен вследствие сомнительности исходных гипотез.
Читать дальше →
Всего голосов 19: ↑16 и ↓3+21
Комментарии22

Что такое Emergent Communication и почему это нужно знать

Время на прочтение10 мин
Количество просмотров2.3K
TL;DR: перевод поста Михаила Нуховича What is Emergent Communication and Why You Should Care: что это такое, зачем это нужно, какие есть точки зрения на задачу и перспективные направления исследований. Обучение с подкреплением, обработка естественного языка, теория игр и философия. Публикуется с любезного разрешения автора.


Вот уже два года как меня увлекла Emergent Communication (EC), по которой я теперь пишу магистерскую диссертацию. В этом году я участвую в организации семинара, благодаря которому у меня и возник интерес к этой области: Workshop on Emergent Communication на конференции NeurIPS. Планирую написать целую серию из постов об EC для широкой аудитории, чтобы помочь всем интересующимся заглянуть в эту сферу (ну и чтобы писать диссертацию было повеселее).

Читать дальше →
Всего голосов 4: ↑3 и ↓1+5
Комментарии4

Метод нечеткой индукции и его применение для моделирования знаний и информационных систем

Время на прочтение7 мин
Количество просмотров3.2K

В настоящей статье предложен разработанный автором метод нечеткой индукции как объединение положений нечеткой математики и теории фракталов, введено понятие степени рекурсии нечеткого множества, представлено описание неполной рекурсии множества как его дробной размерности для моделирования предметной области. В качестве сферы применения предлагаемого метода и созданных на его основе моделей знаний как нечетких множеств рассмотрено управление жизненным циклом информационных систем, включая разработку сценариев использования и тестирования программного обеспечения.

Читать дальше →
Всего голосов 8: ↑4 и ↓4+5
Комментарии0

Граф знаний в Поиске: построение из нескольких источников

Время на прочтение7 мин
Количество просмотров13K


Я хочу рассказать о том, что такое граф знаний и об одном из способов его построения из нескольких тематических источников.

Большое количество запросов в поиске содержат единственную сущность — объект, про который спрашивает пользователь. Это могут быть запросы про каких-то людей, фильмы, сериалы, музыкальные или географические объекты. Когда пользователь задает такой запрос, в выдаче ему можно показать дополнительную информационную карточку в надежде, что информация в карточке будет интересна пользователю. Карточки украшают выдачу и повышают ее наглядность. С помощью информационных карточек мы даём человеку понять, что он пользуется интеллектуальным сервисом, потому что поисковая система поняла, что он имел в виду, о каком именно объекте спрашивал. Более того, эту интеллектуальность можно расширить, отвечая на запрос пользователя прямо на странице выдачи. Например, в ответ на «что посмотреть в Праге» мы можем сразу показать достопримечательности этого города.
Читать дальше →
Всего голосов 18: ↑16 и ↓2+26
Комментарии10