GPGPU *

Технология Nvidia для реализации алгоритмов

xjossy 30 ноября 2021 в 17:25

Вычисляем на видеокартах. Технология OpenCL. Часть 1b. Пишем для OpenCL

Блог компании Яндекс Практикум Высокая производительность *Программирование *GPGPU *Видеокарты

22 июня автор курса «Разработчик C++» в Яндекс.Практикуме Георгий Осипов провёл вебинар «Вычисляем на видеокартах. Технология OpenCL».

После перерыва продолжаем публикацию текстовой версии вебинара.

0. Зачем мы здесь собрались. Краткая история GPGPU
1a. Как работает OpenCL
1b. Пишем для OpenCL
2. Алгоритмы в условиях массового параллелизма
3. Сравнение технологий

В этой части мы наконец напишем на OpenCL полноценную программу, которая нарисует красивое изображение.

У программы для OpenCL есть две части: kernel-код и host-код — то, что выполняется на видеокарте, и то, что выполняется на компьютере. Кроме того, программу нужно скомпилировать и запустить. Всё это будет рассмотрено в сегодняшней статье. Начнём с самого интересного — напишем часть kernel.

В предыдущих сериях

Прежде чем начать, напомним основные термины из предыдущей части.

Читать дальше →

+12

3.5K

kuzin_d 25 ноября 2021 в 16:19

Платформа Deepstream от Nvidia для систем на базе компьютерного зрения

Блог компании Accenture GPGPU *Processing *TensorFlow *Визуальное программирование *

Компьютерное зрение – это увлекательная область искусственного интеллекта, имеющая огромное значение в реальном мире. Forbes ожидает, что к 2022 году рынок компьютерного зрения достигнет оборота 50 миллиардов долларов, а всех нас ждет новая волна стартапов в этой области [1]. В своей статье я хотел бы поделиться своим опытом и опытом Data Science-команды компании Accenture по созданию цифрового решения потоковой аналитики на базе компьютерного зрения.

1.5K

xjossy 29 сентября 2021 в 12:34

Вычисляем на видеокартах. Технология OpenCL. Часть 1a. Как работает OpenCL

Блог компании Яндекс Практикум Высокая производительность *Программирование *GPGPU *Видеокарты

Мы подготовили для вас его текстовую версию, для удобства разбив её на смысловые блоки.

0. Зачем мы здесь собрались. Краткая история GPGPU.
1a. Как работает OpenCL.
1b. Пишем для OpenCL.
2. Алгоритмы в условиях массового параллелизма.
3. Сравнение технологий.

Мы обещали, что разберём написание полноценной программы уже в этой части, но материала оказалось слишком много, и мы разбили эту часть надвое. В первой половине расскажем про основные принципы, которые должен знать каждый OpenCL-разработчик, а во второй напишем программу.

Есть мнение, что для написания эффективного кода для GPU программист обязан понимать архитектуру видеокарты. И это мнение не чьё-нибудь там, а NVIDIA (см. Лекции NVIDIA по GPGPU). Не будем спорить и разберём базовые принципы работы видеокарты.

Читать дальше →

+30

7.3K

xjossy 31 августа 2021 в 13:32

Вычисляем на видеокартах. Технология OpenCL. Часть 0. Краткая история GPGPU

Блог компании Яндекс Практикум Высокая производительность *Программирование *GPGPU *Видеокарты

22 июня автор курса «Разработчик C++» в Яндекс.Практикуме Георгий Осипов провёл вебинар «Вычисляем на видеокартах. Технология OpenCL».

Мы подготовили для вас его текстовую версию, для удобства разбив её на смысловые блоки.

0 (вводная часть). Зачем мы здесь собрались. Краткая история GPGPU.
1. Пишем для OpenCL.
2. Алгоритмы в условиях массового параллелизма.
3. Сравнение технологий.

Основная цель цикла — написать простую, но полноценную программу на OpenCL и объяснить базовые понятия. Программу на OpenCL напишем уже в следующей части цикла, понять которую можно, не читая вводную. Однако во вводной вы найдёте понятия и тезисы, важные при программировании с OpenCL.

Цикл будет полезен и тем, кто уже знаком с OpenCL: в нём мы поделимся некоторыми хаками и неочевидными наблюдениями из собственного опыта.

CPU — в помойку?

В статье будем рассматривать технологию GPGPU. Разберёмся, что значат все эти буквы. Начнем с последних трёх — GPU. Все знают аббревиатуру CPU — Central Processor Unit, или центральный процессор. А GPU — Graphic Processor Unit. Это графический процессор. Он предназначен для решения графических задач.

Но перед GPU есть ещё буквы GP. Они расшифровываются как General-Purpose. В аббревиатуре опускают словосочетание Computing on. Если собрать всё вместе, получится General-Purpose Computing on Graphic Processor Unit, что по-русски — вычисления общего назначения на графическом процессоре.

То есть процессор графический, но мы почему-то хотим вычислять на нём что-то, что вообще к графике никакого отношения не имеет. Например, прогноз погоды, майнинг биткоинов. Моя задача в ближайшее время — объяснить, зачем нужно на процессоре для графики обучать, например, нейросети.

Читать дальше →

+21

8.8K

Seleditor 10 июля 2021 в 12:00

Практическое применение сервера с FPGA

Блог компании Selectel Алгоритмы *GPGPU *Математика *FPGA *

В данной статье будет рассказано о попытке ускорить операции над разреженными булевыми матрицами, реализованные на OpenCL, с помощью замены целевой платформы GPGPU на FPGA.

Эта задача возникла при работе над библиотекой примитивов линейной алгебры, необходимых для решения некоторых задач анализа графов. Данные, структурированные в виде графов, играют огромную роль в современной жизни и встречаются в таких областях, как социальные сети, транспортные и коммуникационные сети, являются основой для набирающих популярность графовых баз данных.

Объем таких данных неуклонно растет и потому для получения хорошей производительности в задачах анализа графов все острее встает вопрос о разработке параллельных алгоритмов, что оказывается нетривиальной задачей из-за нерегулярности данных.

Читать дальше →

+47

6.1K

ivankudryavtsev 29 июня 2021 в 10:40

Атака на Nvidia DeepStream с помощью некорректного фрейма видео в формате H264

Высокая производительность *Информационная безопасность *GPGPU *Машинное обучение *Искусственный интеллект

Nvidia DeepStream - широко известный в узких кругах инструмент для инференса на нейронных сетях и другой высокопроизводительной обработки видео-потоков в реальном времени на оборудовании от Nvidia.

Наша команда занимается разработкой и оптимизацией пайплайнов видео аналитики для работы на базе DeepStream. В текущем проекте мы обнаружили, что некоторые пайплайны виснут. В ходе расследования мы обнаружили вектор атаки, который позволяет сформировать специальный фрейм в H264, вызывающий зависание DeepStream.

3.3K

MagisterLudi 15 июня 2021 в 15:51

На пути к Матрице: как происходит исследования в области построения симуляций и искуственной жизни

Блог компании Timeweb Cloud Open source *Виртуализация *GPGPU *Научно-популярное

Перевод

О проекте

ALiEn — это программа моделирования искусственной жизни, основанная на специализированном физическом и рендеринговом движке в CUDA. Он предназначен для моделирования цифровых организмов, встроенных в искусственные экосистемы, и для имитации условий (до)биотической эволюции.

Узнайте о целях проекта и о том, как начать.

Функции

Реалистичные физические расчеты кинематических и термодинамических процессов повреждаемых и склеиваемых твердых тел
Программируемый материал для моделирования цифровых организмов и эволюции
Встроенный графический редактор для проектирования собственных машин
Моделирование и рендеринг на GPU
Программное обеспечение с открытым исходным кодом и доступно под GNU General Public License, Version 3 (GPLv3).

Под катом два примера («Самопроверяющиеся репликаторы» и «Репликация на основе информации») применения данного программного комплекса.

+15

3.5K

AnomalyImage 7 июня 2021 в 11:21

Дебри графики или как пройти собеседование на программиста компьютерной графики в GameDev

C++ *Git *GPGPU *API *CGI (графика) *

Recovery mode

Ребята, всем привет!!!

Выдалась у меня свободная минута и решил я собрать небольшой гайд на прохождение собеседования по направлению программиста 3D графики для GameDev компаний. Сам я работаю в данной сфере и очень много общаюсь с различными людьми, теми кто только приходит собеседования и теми, кто уже трудится достаточно давно и за плечами не один выполненный проект и множество решенных рабочих вопросов и задач. Если вам интересная данная тема, то прошу всех под кат.

Для большинства компаний принято разделять данную профессию/направление на два:

Первые - это специалист игровой графики и Вторые - это специалисты компьютерной графики. В чем же разница? Скажем так, первое является закономерным продолжением второго, но не всегда. Например, вы начинаете работать как VFX специалист, создаете партикловые (частицы) эффекты, "прикручиваете" к ним трехмерные модели, собираете все из частей, пишите шейдера и работаете с кодовой базой. То есть здесь вы больше сконцентрированы на визуальном оформлении игры и отдельных ее элементах. В ваши задачи входит разработка визуальных эффектов на "приемлемом" уровне с учетом общей стилистики игры, ее жанра, цветового оформления (хорор, mathc-3d, ферма, песочница и т.д.). Вопросы оптимизации, здесь важны, но они не так глобальны;

-11

6.5K

host_m 6 мая 2021 в 12:55

Используем GPU для повышения производительности JavaScript

Блог компании VDSina.ru Разработка веб-сайтов *JavaScript *GPGPU *

Перевод

Мы, разработчики, всегда стремимся искать возможности повышения производительности приложений. Когда речь идёт о веб-приложениях, то улучшения обычно вносятся только в код.

Но думали ли вы об использовании мощи GPU для повышения производительности веб-приложений?

В этой статье я расскажу о библиотеке ускорения JavaScript под названием GPU.js, а также покажу вам, как повысить скорость сложных вычислений.

Что такое GPU.js и почему его стоит использовать?

Если вкратце, GPU.js — это библиотека ускорения JavaScript, которую можно использовать для любых стандартных вычислений на GPU при работе с JavaScript. Она поддерживает браузеры, Node.js и TypeScript.

Кроме повышения производительности есть и множество других причин, по которым я рекомендую использовать GPU.js:

В основе GPU.js лежит JavaScript, что позволяет использовать синтаксис JavaScript.
Библиотека берёт на себя задачу автоматической транспиляции JavaScript на язык шейдеров и их компиляции.
Если в устройстве отсутствует GPU, она может «откатиться» к обычному движку JavaScript. То есть вы ничего не потеряете, работая с GPU.js.
GPU.js можно использовать и для параллельных вычислений. Кроме того, можно асинхронно выполнять множественные вычисления одновременно и на CPU, и на GPU.

Учитывая всё вышесказанное, я не вижу никаких причин не пользоваться GPU.js. Давайте узнаем, как его освоить.

Читать дальше →

+34

11K

BashNiPineft 28 декабря 2020 в 07:15

«Томограф» для нефтегазовых месторождений, или Пересечение трёхмерной расчётной сетки и плоскости на CUDA

Блог компании РН-БашНИПИнефть Программирование *C++ *GPGPU *Карьера в IT-индустрии

В данной статье приведены описание и алгоритм решения задачи построения рисунка внутренностей месторождения, являющегося результатом пересечения расчётной сетки с плоскостью. А также приведены тайминги построения решения, которые получаются на типичном компьютере геолога-модельера или гидродинамика.

Визуализация расчётной сетки и куба

Читать дальше →

+12

2.2K

LittleCherry 14 декабря 2020 в 17:59

AES против осциллографа

Криптография *GPGPU *

Из песочницы

Слово "хакер" обрело свое нынешнее звучание лишь во второй половине XX века благодаря журналистам. Изначально хакерами именовали специалистов, обладающих обширными знаниями в области компьютерных технологий и умеющих виртуозно применять их. Именно о деятельности одной из групп таких хакеров пойдет речь в данной статье.

+20

5.5K

vvvphoenix 11 декабря 2020 в 14:10

Software ecosystems: принципы построения

Блог компании Huawei Высокая производительность *GPGPU *История IT Процессоры

У этой статьи тяжелая судьба. Пару месяцев назад меня попросили написать обзор на предмет построения программных экосистем для разных архитектур. Я поначалу отнекивался да отшучивался в том духе что, экосистема –это не биология. Это — даже не технология. Это — исключительно про деньги. И иногда про политику. Потом собрал волю в кулак, мысли в кучу, cел и написал все буквально за один день. На английском. Затем обзор перевели на китайский и опубликовали. “По дороге” переводчик существенно улучшил текст и добавил пару интересных мыслей. Потом я решил, что текст может быть небезынтересен аудитории Хабра, а также полезен мне, чтобы ссылаться на него в дальнейшем. И начал ваять русский вариант, вооружившись английским оригиналом и китайским переводом. Это была та еще борьба со специфичными английскими терминами (SW ecosystem ?= программная экосистема, enabling ?= продвижение, application engineer ?= инженер по приложениям) и малопонятными пока иероглифами. В итоге русский текст занял больше времени, чем английский и китайский вместе взятые… Так бывает.

Читать дальше →

2.5K

Stalker31 31 октября 2020 в 15:57

Сравнение времени выполнения алгоритма на CPU и GPU

C++ *GPGPU *Параллельное программирование *

Recovery mode

Использование CUDA Runtime API для вычислений. Сравнение CPU и GPU вычислений

В данной статье я решил провести сравнение выполнения алгоритма написанного на C++ на центральном и графическом процессоре(выполнение вычислений с помощью Nvidia CUDA Runtime API на поддерживаемом GPU Nvidia). CUDA API позволяет выполнение некоторых вычислений на графическом процессоре. Файл c++ использующий cuda, будет иметь расширение .cu.
Схема работы алгоритма приведена ниже.

Задача алгоритма состоит в том, что найти возможные числа X, при возведении которых в степень degree_of, будет получатся исходное число max_number. Сразу отмечу, что все числа которые будут передаваться GPU, будут хранится в массивах. Алгоритм, выполняемый каждым потоком, имеет приблизительно следующий вид:

Читать дальше →

-5

5.2K

tony-space 14 сентября 2020 в 13:10

Симуляция подъёмной силы Ньютона методом частиц на CUDA

Программирование *C++ *GPGPU *Параллельное программирование *Физика

Из песочницы

https://www.youtube.com/playlist?list=PLwr8DnSlIMg0KABru36pg4CvbfkhBofAi

Как-то на Хабре мне попалась довольно любопытная статья “Научно-технические мифы, часть 1. Почему летают самолёты?”. Статья довольно подробно описывает, какие проблемы возникают при попытке объяснить подъёмную силу крыльев через закон Бернулли или модель подъёмной силы Ньютона (Newtonian lift). И хотя статья предлагает другие объяснения, мне бы всё же хотелось остановиться на модели Ньютона подробнее. Да, модель Ньютона не полна и имеет допущения, но она даёт более точное и интуитивное описание явлений, чем закон Бернулли.

Основной недостаток этой модели — это отсутствие взаимодействия частиц газа друг с другом. Из-за этого при нормальных условиях она даёт некорректные результаты, хотя всё ещё может применяться для экстремальных условий, где взаимодействием можно пренебречь.

Я же решил проверить, что же произойдёт в модели Ньютона если её улучшить. Что если добавить в неё недостающий элемент межатомного взаимодействия? Исходный код и бинарники получившегося симулятора доступны на GitHub.

Перед тем как мы начнём, я бы хотел сразу обозначить, что это статься не о физике самой модели. Эта статья о GPGPU-программировании. Мы не будем рассматривать физические свойства самой модели, потому что она груба и не подходит для настоящих расчётов. И всё же, эта неточная модель даёт куда более интуитивное описание явления подъёмной силы, чем закон Бернулли.

+64

11K

saul 15 августа 2020 в 10:22

Новости Intel Arch Day 2020: Intel Xe GPU в ассортименте

Блог компании Intel GPGPU *Производство и разработка электроники *Процессоры

Мы продолжаем свой репортаж о новостях, которые принес прошедший всего день назад Intel Architecture Day 2020. Сегодняшняя их порция касается графических процессоров Intel Xe — стал известен весь ассортимент их микроархитектур на ближайшую перспективу. Не обошлось без дополнений и обновлений.

Читать дальше →

3.2K

Danil6969 1 июля 2020 в 22:46

Пишем спецификацию под Nvidia Kepler (бинарники CUDA, версия языка sm_30) для Ghidra

GPGPU *C *Реверс-инжиниринг *

Из песочницы

Для обычных процессорных языков уже написано довольно много спецификаций для Ghidra, однако для графических ничего нет. Оно и понятно, ведь там своя специфика: предикаты, константы, через которые передаются параметры в том числе, и другие вещи, унаследованные от шейдеров. Кроме того формат, который используется для хранения кода, зачастую проприетарный, и его нужно самостоятельно ревёрсить.

В этой статье на двух примерах разберёмся, что к чему.

Читать дальше →

+17

1.6K

ph_piter 6 июня 2020 в 09:56

Как GPU-вычисления буквально спасли меня на работе. Пример на Python

Блог компании Издательский дом «Питер» Высокая производительность *Python *Программирование *GPGPU *

Перевод

Привет, Хабр!

Сегодня мы затрагиваем актуальнейшую тему — Python для работы с GPU. Автор рассматривает пример, тривиальный в своей монструозности, и демонстрирует решение, сопровождая его обширными листингами. Приятного чтения!

Читать дальше →

+38

39K

vvvphoenix 28 мая 2020 в 12:56

По ту сторону закона Мура

Блог компании Huawei Высокая производительность *GPGPU *Процессоры

Слухи о смерти закона Мура ходили, сколько я себя помню. Рассуждения о том, что мы приближаемся к размерам атома и о том, что скоро вся затея станет нерентабельной, я слышал и 30, и 20, и 10 лет назад. Вот только инженеры раз за разом их опровергали. Именно инженерный гений сделал закон Мура одним из “самоисполняющихся пророчеств”.

Не собираюсь рассуждать о том, достигла технология своего предела или еще нет. Несмотря на радиофизическое образование, я в ней разбираюсь очень условно. Желающим вникнуть могу посоветовать обратиться к недавнему обзору. Я же подпишусь под точкой зрения еще одного очень уважаемого мной мыслителя Боба Колвелла.

Teм временем чипмейкеры продолжают строить (ну или по крайней мере анонсировать) новые фабрики, работающие по новым технологиям. Значит, это все еще выгодно. По мне так “пациент скорее жив, чем мертв”. Mуровская экспансия остановится тогда, когда сервер с двумя процессорами произведенными по новой технологии станет дороже, чем сервер с 4мя произведенными по старой. А это пока далеко не так. Мне доводилось работать и с 4-head и даже с 8-head. Но они собираются на заказ и стоят как маленький самолет.

Моя же задача сегодня рассказать о том как технология влияет на архитектуру и программирование. О том что нас ждет “по ту сторону закону Мура”. Ибо многие тенденции очевидны уже сейчас. Итак.

Читать дальше →

4.3K

vvvphoenix 8 мая 2020 в 09:00

О тенденциях развития архитектуры процессоров, или почему я верю в успех Huawei на серверном рынке

Блог компании Huawei Высокая производительность *GPGPU *Процессоры

Мы живем в интересные времена. Мне кажется, следующие 2-3 года определят, куда пойдет развитие архитектуры на ближайшее десятилетие. Сейчас на рынке серверных процессоров есть несколько игроков, представляющих совершенно разные подходы к технологии. И это очень здорово (я даже затрудняюсь сказать, на какой слог падает ударение в последнем слове :))
.
А ведь еще лет 5-6 назад казалось, что время застыло и развитие остановилось. Упершись в разного рода ограничения (power wall, scalability wall и т.п.). Я немного рассказывал об этом вот здесь. Закон Мура был поставлен под сомнение и особо горячие теоретики предлагали ввести в него логарифмические поправки :) Доминация Intel на рынке серверных процессоров представлялась тогда незыблемой. AMD не оказывал серьезной конкуренции, GPGPU от NVidia выглядели сугубо нишевым продуктом, а попытки ARM пробиться на серверный рынок не имели успеха.

Читать дальше →

+15

5.8K

javamain 2 мая 2020 в 14:57

Программирование GPU на Java

Программирование *Java *GPGPU *

Recovery mode

Перевод

Получение доступа к GPU из Java раскрывает огромную мощь. Здесь рассказывается как GPU работает и как получить доступ из Java.

Программирование устройства графического процессора (GPU) является заоблачным миром для Java программистов. Это понятно, так как обычные задачи для Java не подходят для GPU. Тем не менее, GPU обладают терафлопсами производительности, так давайте исследуем их возможности.
Для того чтобы сделать топик доступным, я потрачу некоторое время объясняя архитектуру GPU вместе с небольшой историей, которая облегчит погружение в программирование железа.

Однажды мне показали отличия GPU от CPU вычислений, я покажу как использовать GPU в мире Java. Наконец, я опишу главные фреймворки и библиотеки доступные для написания кода на Java и запуска их на GPU, и я приведу некоторые примеры кода.

Читать дальше →

11K

2 3 ...

6 7

GPGPU *

Вычисляем на видеокартах. Технология OpenCL. Часть 1b. Пишем для OpenCL

В предыдущих сериях

Новости

Платформа Deepstream от Nvidia для систем на базе компьютерного зрения

Вычисляем на видеокартах. Технология OpenCL. Часть 1a. Как работает OpenCL

Вычисляем на видеокартах. Технология OpenCL. Часть 0. Краткая история GPGPU

CPU — в помойку?

Минуточку внимания

Практическое применение сервера с FPGA

Атака на Nvidia DeepStream с помощью некорректного фрейма видео в формате H264

На пути к Матрице: как происходит исследования в области построения симуляций и искуственной жизни

О проекте

Дебри графики или как пройти собеседование на программиста компьютерной графики в GameDev

Используем GPU для повышения производительности JavaScript

Что такое GPU.js и почему его стоит использовать?

«Томограф» для нефтегазовых месторождений, или Пересечение трёхмерной расчётной сетки и плоскости на CUDA

AES против осциллографа

Software ecosystems: принципы построения

Сравнение времени выполнения алгоритма на CPU и GPU

Использование CUDA Runtime API для вычислений. Сравнение CPU и GPU вычислений

Симуляция подъёмной силы Ньютона методом частиц на CUDA

Новости Intel Arch Day 2020: Intel Xe GPU в ассортименте

Пишем спецификацию под Nvidia Kepler (бинарники CUDA, версия языка sm_30) для Ghidra

Как GPU-вычисления буквально спасли меня на работе. Пример на Python

По ту сторону закона Мура

О тенденциях развития архитектуры процессоров, или почему я верю в успех Huawei на серверном рынке

Программирование GPU на Java

Вклад авторов

Ваш аккаунт

Разделы

Информация

Услуги

GPGPU *

В предыдущих сериях

CPU — в помойку?

Выставка платёжных техологий

Конкурс технических статей Технотекст 2021

Истощающая тревога: что такое стресс и как с ним бороться

О проекте

Что такое GPU.js и почему его стоит использовать?

Использование CUDA Runtime API для вычислений. Сравнение CPU и GPU вычислений

Ваш аккаунт

Разделы

Информация

Услуги