Как стать автором
Обновить
5.72
Рейтинг

Краудсорсинг

Использование ресурсов толпы

Сначала показывать
  • Новые
  • Лучшие
Порог рейтинга
  • Все
  • ≥0
  • ≥10
  • ≥25
  • ≥50
  • ≥100

6 правил по обеспечению качества данных для машинного обучения

Data Mining *Big Data *Машинное обучение *Краудсорсинг Софт
Перевод
«Качество — это не действие, а привычка», — сказал великий древнегреческий философ Аристотель. Эта идея справедлива сегодня так же, как и более двух тысяч лет назад. Однако качества добиться не так легко, особенно когда дело касается данных и технологий наподобие искусственного интеллекта (ИИ) и машинного обучения.

В некоторых областях можно почти без проблем использовать данные с высокой частотой ошибок, в других же система даёт сбой при малейших погрешностях в большом датасете. Принцип «мусор на входе, мусор на выходе» нужно воспринимать со всей серьёзностью. Мельчайшая некорректность в наборах данных может иметь большое влияние на модель и приводить к созданию бесполезных результатов. Чистота и целостность данных — ключевой аспект в создании сложных моделей машинного обучения.

Читать дальше →
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 2.1K
Комментарии 0

Проект электронного мультитула QUARK. Часть 4

Open source *Развитие стартапа Производство и разработка электроники *Гаджеты Краудсорсинг

Часть 1, Часть 2, Часть 3. Страница на краудфандинге

В предыдущей части я сообщил о запуске кампании и спросил у вас мнения насчет того, как лучше поступить с формой корпуса устройства. Юзеры @sshmakov, @dizatorr, тогда предложили сделать небольшой выступ со стороны дисплея, что исключит возможность устойчивого положения «Щупом к верху». А @Ivnika и @Olegun предложил сделать защитное стекло дисплея полукруглым. Прорабатываем оба эти варианта.

Очевидным упущением для меня стало то, что я плохо объяснил куда подключается второй щуп. Такие вопросы возникли как у читателей, так и у бекеров CrowdSupply. Думаю два этих фото все расставят по местам:...

Читать далее
Всего голосов 17: ↑17 и ↓0 +17
Просмотры 3.9K
Комментарии 26

Карты распространения борщевика Сосновского и зачем мы сделали свою

Геоинформационные сервисы *Краудсорсинг Экология

В этой заметке я расскажу о том, какие бывают карты распространения борщевика, а также, что нас побудило сделать свою карту распространения борщевика Сосновского в Московской области за 2021 год. И что у нас в итоге получилось.

Опасно: борщевик Сосновского!
Всего голосов 12: ↑12 и ↓0 +12
Просмотры 11K
Комментарии 17

Проект электронного мультитула QUARK. Часть 3

Open source *Развитие стартапа Производство и разработка электроники *Гаджеты Краудсорсинг

Первая и вторая части.

Два ОЧЕНЬ долгих месяца прошло с момента последней публикации. За это время я превратился в профессионального ждуна. А с платформой Crowdsupply я начал работать аж ТРИ месяца назад! Сейчас это даже писать смешно. Всего лишь несколько месяцев упорной работы, а по ощущениям год. Но мы, таки, запустились! Ииии-хаа!!!

Читать далее
Всего голосов 27: ↑27 и ↓0 +27
Просмотры 6.8K
Комментарии 58

Как организовать разметку данных для машинного обучения: методики и инструменты

Data Mining *Обработка изображений *Big Data *Машинное обучение *Краудсорсинг
Перевод

Если бы у data science существовал собственный зал славы, отдельную его часть нужно было бы посвятить разметке. Памятник отвечающим за разметку выглядел бы как атлант, держащий огромный камень, символизирующий их тяжелый и скрупулезный труд. Собственной стелы заслужила бы и база данных изображений ImageNet. За девять лет её контрибьюторы вручную разметили более 14 миллионов изображений. Даже представлять этот труд утомительно.

Хотя разметка и не является особо интеллектуальным трудом, она всё равно остаётся серьёзной проблемой. Разметка — неотъемлемый этап предварительной обработки данных для контролируемого обучения. Для этого стиля обучения моделей используются исторические данных с заранее заданными целевыми атрибутами (значениями). Алгоритм может находить целевые атрибуты, только если их указал человек.

Занимающиеся разметкой люди должны быть чрезвычайно внимательны, поскольку каждая ошибка или неточность отрицательно влияет на качество датасета и на общую производительность прогнозирующей модели.

Как получить высококачественный размеченный набор данных и не поседеть в процессе работы? Главной трудностью являются выбор ответственных за разметку, оценка необходимого для неё времени и подбор наиболее подходящих инструментов.
Читать дальше →
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 2.8K
Комментарии 3

7 способов получить качественные размеченные данные для машинного обучения

Data Mining *Обработка изображений *Big Data *Машинное обучение *Краудсорсинг
Перевод
Наличие размеченных данных необходимо для машинного обучения, но получение таких данных — непростая и дорогостоящая задача. Мы рассмотрим семь способов их сбора, в том числе перепрофилирование, поиск бесплатных источников, многократное обучение на данных с постепенно повышающимся качеством, а также другие способы.

Любой data scientist знает, что необученная ML модель бесполезна. Без высококачественных размеченных данных для обучения контролируемое, обучение разваливается; при этом невозможно гарантировать, что модели смогут прогнозировать, классифицировать или каким-то иным образом анализировать интересующее нас явление с хоть какой-нибудь точностью.


При проведении контролируемого обучения (supervised learning) лучше не разрабатывать модель, если нет возможности найти подходящие данные для обучения. Даже если вы нашли подходящий набор обучающих данных, он не особо полезен, если его элементы не размечены, не снабжены метками и аннотациями для эффективного обучения алгоритма.
Читать дальше →
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 2.8K
Комментарии 0

Мой опыт запуска краудфандинговой кампании

Блог компании Маклауд Краудсорсинг Лайфхаки для гиков
Tutorial
Что такое краудфандинг, надеюсь, рассказывать нет необходимости, потому без лишних предисловий поведаю о своем опыте работы с одним из таких сервисов. Речь пойдет не о таком гиганте как Kickstarter, а о более специализированном на «железных» open source проектах сервисе CrowdSupply. Но обо всем по порядку. 

Значит пилил я, пилил свой девайс, себе в копилку очередных погодных информеров, раздвигателей штор, котопоилок (нужное подчеркнуть) и, внезапно… Допилил. Ну то есть, ребята которым показал, сказали, что такое нельзя прятать от общественности и предложили показать на суд публики. Штош, попробуем. Попробовал. Понравилось. Предложили запуститься на CrowdSupply.

Итак, что эта за платформа и в чем преимущество (и есть ли оно) перед Kickstarter. Во-первых, создатели сервиса делают упор на открытость и «железячность» проектов. И действительно, если полистать список, можно убедиться, что подавляющее большинство профинансированных проектов, это устройства реализованные в железе, хотя в числе первых были и довольно необычные. Например этот кусок э-ээм… говядины в шоколаде:


Читать дальше →
Всего голосов 31: ↑30 и ↓1 +29
Просмотры 2.8K
Комментарии 7

Новые рекорды: найдено 51-ое простое число Мерсенна

Научно-популярное Краудсорсинг
Из песочницы
Перевод

(Примечание переводчика: не нашёл публикации (-ий) по данной теме на Хабре.)

Блоуинг Рок, Северная Каролина, 21 декабря 2018 года — организация Great Internet Mersenne Prime Search (GIMPS, масштабный Интернет-проект по поиску простых чисел Мерсенна) обнаружила самое большое известное простое число 282589933 - 1, состоящее из 24 863 048 знаков. Компьютер добровольца Патрика Ляроша вычислил его 7 декабря 2018 года. Патрик — один из тысяч, использующих бесплатное ПО GIMPS.

Новое простое число, также известное как M82589933, вычислено перемножением 82 589 933 двоек и вычитанием единицы. Оно превосходит предыдущее рекордное простое число более чем на полтора миллиона разрядов, в особом классе исключительно редких простых, известных как числа Мерсенна. Это всего пятьдесят первое открытое простое число Мерсенна; вычисление каждого последующего становится сложнее. Простые числа Мерсенна названы по имени французского монаха Марина Мерсенна, изучавшего эти числа больше 350 лет назад. Основанная в 1996 году GIMPS обнаружила последние 17 простых чисел Мерсенна.

Читать дальше →
Всего голосов 19: ↑18 и ↓1 +17
Просмотры 14K
Комментарии 41

Полежать в эконом-классе? Zephyr Aerospace разработал двухэтажные купе для самолетов. И можно сделать почти кровать

Блог компании ITSOFT Краудсорсинг Транспорт Будущее здесь

Если у вас есть опыт длительных перелетов, то вы помните это чувство, когда очень хочется полежать, но нет. Теперь появился шанс, что и в эконом-классе можно будет летать с комфортом.

Читать далее
Всего голосов 12: ↑11 и ↓1 +10
Просмотры 5.7K
Комментарии 31

Википедия купается в деньгах? — Взгляд из России

Управление продуктом *Бизнес-модели Копирайт Научно-популярное Краудсорсинг

Сегодня мы прочли статью «Википедия купается в деньгах» и были очарованы. Там рассказано, как фонд Wikimedia собирает пожертвования по всему миру, и как развивается его целевой капитал. Да, всё в статье правда: в США и фонд есть, и активы есть, и доход есть. Однако в нашей-то стране дело обстоит по-другому. Поистине «тревожит» российских редакторов-добровольцев Википедии совсем иное.

И что теперь делать-то?
Всего голосов 107: ↑94 и ↓13 +81
Просмотры 19K
Комментарии 68

Википедия купается в деньгах — зачем молить о пожертвованиях?

Блог компании ITSumma Управление продуктом *Бизнес-модели Краудсорсинг Финансы в IT
Перевод
Проект гораздо богаче, чем кажется.



Некоммерческая организация Wikimedia Foundation (WMF), которая владеет Википедией и другими сайтами UGC, вот-вот достигнет десятилетней цели: собрать $100 млн в долгосрочном резерве Wikimedia Endowment. Это произойдёт на пять лет раньше, чем планировалось. Объём чистых активов (net assets) составляет около $200 млн по состоянию на июнь прошлого года. Сейчас уже около $300 млн. Доходы непрерывно растут. Согласно внутренним документам, за первые девять месяцев текущего финансового года фонд собрал пожертвований на $142 млн — и уже побил рекорд прошлого года.

Эта информация может удивить доноров и пользователей по всему миру, которые видели баннеры для сбора средств в Википедии. Их показывают в разное время в разных странах. В прошлом году их впервые начали крутить в Индии. В настоящее время эти баннеры показывают жителям охваченной пандемией Латинской Америки. Они создают впечатление, что WMF с огромным трудом поддерживает Википедию в рабочем состоянии… Послания жалобные: «В этот четверг Википедия действительно нуждается в вас. Это уже десятое обращение, которое мы вам показали. 98% наших читателей не жертвуют, они отворачиваются… Мы просим вас, пожалуйста, не надо скроллить от нас» (We ask you, humbly, don’t scroll away)».
Всего голосов 77: ↑71 и ↓6 +65
Просмотры 28K
Комментарии 153

Пришло время и тебе встать на защиту Sci-hub

Open source *Читальный зал Научно-популярное Краудсорсинг
Перевод
image


  • Быстрый старт спасения Sci-Hub: загрузите 1 случайный торрент (100 ГБ) из коллекции scimag и скачайте его. Оставайтесь на раздаче навсегда.
  • Трекер успеха миссии, спасибо phillm
  • Участвуйте в проектах Sci-Hub с открытым исходным кодом: freereadorg/awesome-libgen
  • Присоединяйтесь к /r/scihub, чтобы оставаться в курсе


Спасательная миссия для Sci-Hub и Open Science


Elsevier и USDOJ объявили войну Sci-Hub и Open Science. Эпоха Sci-Hub и Александры, сражающихся в одиночку, должна закончиться. Мы должны встать на её сторону.

7 мая Александра Элбакян из Sci-Hub сообщила, что ФБР прослушивает ее аккаунты более двух лет. Эта новость появилась после того, как Twitter заставил замолчать официальный аккаунт Sci_Hub в Твиттере, потому что индийские ученые организовались против своего министерства и иска Elsevier.

Сам Sci-Hub в настоящее время заморожен и не загружал никаких новых статей с декабря 2020 года. Эта спасательная миссия сосредоточена на поддержке раздач (seeding) коллекции статей, чтобы подготовиться к потенциальному закрытию Sci-Hub.

Александра Элбакян из Sci-Hub, книжный воитель Library Genesis, Аарон Шварц и бесчисленное множество других неназванных боролись за то, чтобы освободить науку от хватки коммерческих издателей. Сегодня они делают это скрытно, в одиночку, без ведома, опасаясь тюремного заключения, и даже сейчас их прослушивает ФБР. Они жертвуют всем ради одного видения: Open Science.
Читать дальше →
Всего голосов 135: ↑131 и ↓4 +127
Просмотры 46K
Комментарии 377

Пишем расширение для MediaWiki

Блог компании Veeam Software CMS *Разработка веб-сайтов *Краудсорсинг Подготовка технической документации *
Tutorial

В рунете я почти не встречал материалов о том, как писать расширения для MediaWIki. Основной стартовой точкой был и остается официальный сайт платформы, но там процесс расписан не очень дружелюбно по отношению к новичкам. Попробуем же это исправить!

В этой статье я покажу, как написать простейшее расширение для Медиавики, включающее в себя новый метод API, расширение парсера и немного js/css для фронтенда. А чтобы не было скучно, приплетем сюда работу с Google Knowledge Graph.

<?php explode( ' ', 'your mind' ); →
Всего голосов 10: ↑10 и ↓0 +10
Просмотры 1.8K
Комментарии 5

Как сделать, чтобы базой знаний начали пользоваться человеческие люди

Блог компании Veeam Software Управление сообществом *Краудсорсинг Подготовка технической документации *

Корпоративная база знаний — это не только и не столько площадка на базе какого-нибудь вики-движка, сколько люди и процессы, стоящие за ней. При внедрении вики-платформы самое сложное — это не тонкая настройка движка или попутных расширений: самое сложное — это сделать так, чтобы коллеги наконец начали пользоваться поднятой вами базой знаний.

Я начал заниматься базой знаний, будучи зеленым джуном, так что все описанные в посте рекомендации применимы даже в том случае, если у вас нет административных или финансовых ресурсов. Иными словами, советов в духе "просто заставьте всех писать и штрафуйте непослушных" тут не будет, мы пойдем другим путем.

Приобщиться к не очень тайным знаниям →
Всего голосов 28: ↑26 и ↓2 +24
Просмотры 8.9K
Комментарии 3

Как документировать базы данных на MediaWiki и не свихнуться

Блог компании Veeam Software CMS *Семантика *Администрирование баз данных *Краудсорсинг

В этой статье пойдет речь о том, как я подошел к документированию баз данных продуктов Veeam на MediaWiki движке. Сразу оговорюсь, что документация эта служит исключительно для внутреннего пользования, поэтому я много где позволял себе определенные вольности.

Хоть главной причиной выбора платформы MediaWiki и было нежелание плодить без необходимости сайты документации, это решение также позволило воспользоваться многими преимуществами MediaWiki: понятный и привычный интерфейс, удобство поиска, полуавтоматическое создание документации и многое-многое другое.

Ну что ж, рассказывай →
Всего голосов 14: ↑13 и ↓1 +12
Просмотры 4.2K
Комментарии 1

«Популяризация исторического контента в Википедии»: круглый стол в Казани

Конференции Копирайт Научно-популярное Краудсорсинг
19 февраля 2021 года Институт истории Академии наук Республики Татарстан (Институт Марджани) провёл круглый стол по теме «Популяризация исторического контента в Википедии». Учёные историки обозначили круг проблем, которые возникают у них при работе с Википедией.

Дискуссия обратилась к двум ключевым вопросам: 1) как избегать этнических конфликтов, 2) как сделать научную литературу доступной для самого широкого использования.
Читать дальше →
Рейтинг 0
Просмотры 625
Комментарии 1

Как перестать принимать слабительное для мозга, чтобы не спустить свою жизнь в унитаз

Краудсорсинг Лайфхаки для гиков Мозг

Однажды наступит время, когда мы сможем узнать всё обо всём, избежать бОльшую часть всевозможных проблем, жить в гармонии с природой и окружающими людьми, наслаждаясь каждым новым днем в богатстве и здравии. А пока…

Мы живем в мире, где научные данные перемешаны и противоречат друг другу, а система образования с каждым днём всё сильней отстает от действительности. Предметы и отрасли науки находятся в рассинхроне, что не позволяет осознать нечто приближенное к истине на стыке наук. Расфокусировка внимания, дефицит времени и невозможность одновременно следить за происходящим в разных сферах сильно усложняют познание мира и понимание происходящих в нем процессов. В этой связи затруднено формирование понятийного аппарата через расширение познаний в разных областях знаний.

Что будет дальше?
Всего голосов 45: ↑15 и ↓30 -15
Просмотры 15K
Комментарии 30

Истории основателей: Грейс Гэри, основательница Watsi (YC W13)

Развитие стартапа Краудсорсинг Интервью
Перевод
image

Watsi — это некоммерческая организация, которая позволяет любому напрямую финансировать здравоохранение, которое меняет жизнь людей, которые в нем нуждаются, по всему миру.

В: Чем вы занимались до создания Watsi?

Мы живем в мире, где потенциал универсален, а возможности — нет. Я всегда хотела, чтобы моя жизнь изменила это. До того, как я начала работать над Watsi, я изучала глобальные исследования и политологию в колледже, проводила исследования беженцев в Гане и работала в крупной гуманитарной правозащитной организации в Округе Колумбия. Всё в попытке понять, что делают люди, чтобы создать возможности для тех, кто родился без этого, и как я могу помочь. Именно во время работы в Kiva (веб-сайт в Сан-Франциско, который позволяет любому финансировать микрозайм для предпринимателя из развивающейся страны) меня воодушевила идея о том, что технологии могут более напрямую связывать людей и изменять то, как мы создаем возможность в жизни друг друга.

В: Как начался проект Watsi?

Оригинальная идея Watsi была у Чейза. Когда он служил в Корпусе Мира в Центральной Америке, женщина села в автобус, в котором ехал Чейз, и попросила пожертвования на оплату медицинского обслуживания ее сына. Она вдохновила его на создание Watsi, назвав его в честь города, по которому он путешествовал в то время.
Читать дальше →
Всего голосов 17: ↑10 и ↓7 +3
Просмотры 899
Комментарии 0

Чему НКО могут поучиться у стартапов

Развитие стартапа Управление продуктом *Краудсорсинг
Перевод
image

Y Combinator поддержал свою первую некоммерческую организацию, платформу финансирования лечения Watsi, в 2013 году.

Несколько выпускников некоммерческих организаций YC собрались вместе, чтобы обсудить свой опыт создания 501©(3)-организаций в логике стартапов. Здесь мы хотели бы поделиться пятью ключевыми мыслями из их вечерней беседы:

Ставьте четкие цели для роста


Несмотря на свой статус 501©(3), новые некоммерческие организации не должны думать о росте сильно иначе, нежели их некоммерческие коллеги.

Многие некоммерческие организации отговариваются от завышенных ожиданий в отношении роста и показателей из-за долгосрочного характера их миссий. Они думают: «Мы стремимся вылечить болезнь или даже устранить системный дисбаланс в обществе. Невозможно измерить это с помощью ежемесячной или ежеквартальной цели роста». Или: «Мы работаем над грандиозной миссией. Измерение показателей только собьёт нас с пути».

Подобные заявления — отговорки. Независимо от того, над чем вы работаете, важно разбить свое долгосрочное видение на шаги и ставить цели на постоянное наращивание результатов.

Даже если вы решаете большую проблему, вы должны найти способ ее измерить в режиме реального времени, чтобы ваша команда оставалась мотивированной и не теряла с темпа.
Читать дальше →
Всего голосов 19: ↑11 и ↓8 +3
Просмотры 700
Комментарии 0

Бизнес в 11 лет — возможен! Свое дело с нуля от Well Slimy по шагам

Фриланс Развитие стартапа Управление продажами *Бизнес-модели Краудсорсинг

Бизнес в 11 лет — возможен! Свое дело с нуля от Well Slimy по шагам

Кстати, получилась неплохая инструкция для тех, кто хочет ступить на путь предпринимательства, имея 100т.р. на входе, а за 1 год сделать 3.2 млн. выручки. Делимся опытом. Будем рады, если кому-то пригодится.

Проект Well Slimy был для нас своего рода вызовом. Получится ли без инвестиций и специальных знаний, чисто на энтузиазме мамы и дочки сделать бизнес с нуля? Проверить, можно ли заработать на хлеб с маслом без многолетнего опыта, большой команды и вложив 100 тысяч рублей на старте? Доказать, что если есть идея, усердие и желание, можно достичь многого без посторонней помощи, находясь в России и даже в период пандемии. 

Конечно, не все так просто и радужно. Работы было проделано очень много, практически без выходных и праздников. Но полученный опыт - бесценен, график работы - свободный, а предпринимательский дух раздвигает границы, поднимает настроение и дает уверенность в завтрашнем дне, сплочает семью вокруг общего дела.

Читать далее
Всего голосов 47: ↑18 и ↓29 -11
Просмотры 11K
Комментарии 51

Вклад авторов