/ фото Fritzchens Fritz PD
Что изменилось
NVIDIA добавила в статью 2.1.3 пользовательского соглашения GeForce Software новое положение. Оно гласит: «No Datacenter Deployment. The SOFTWARE is not licensed for datacenter deployment, except that blockchain processing in a datacenter is permitted» и касается продуктов NVIDIA GeForce и Titan. Теперь запрещено использовать эти карты для любых задач, кроме работы с блокчейн-технологиями. Для работы с машинным обучением и моделирования в ЦОД теперь можно использовать только Tesla V100. Почему компания приняла такое решение расскажем далее.
В чем причина
Компания NVIDIA начинала свой путь как разработчик графических процессоров для игровой индустрии. Позднее эти ускорители стали использовать в исследовательских и бизнес-целях, в том числе в дата-центрах (о том, почему GPU лучше подходит для высокопроизводительных вычислений, мы уже писали здесь).
Однако, как заявляют представители NVIDIA, графические ускорители GeForce и Titan не предназначены для развертывания в дата-центрах. Работа ЦОДов связана с высокими требованиями к аппаратным и программным решениям в режиме 24x7. При этом нельзя гарантировать работоспособность этих карт в помещении с высокой плотностью оборудования в стойках и, соответственно, высокой температурой окружающей среды.
Взамен NVIDIA предлагает использовать Tesla V100 — графический ускоритель, разработанный специально для работы в условиях машинных залов и обладающий большей производительностью. Если говорить о 64-битных операциях с числами с плавающей запятой, Tesla гораздо мощнее GeForce: 7 терафлопсов против 0,355 терафлопсов (GTX 1080 Ti). Карты Tesla также превосходят GeForce на операциях с числами половинной и одинарной точности с плавающей запятой.
В NVIDIA также считают решение Tesla более стабильным, потому — более подходящим для бизнеса. Например, стабильность обеспечивает технология NVIDIA NVLink — компьютерная шина, которая служит для связи CPU и GPU и использует протоколы кеш-когерентности.
Кого коснется изменение
Архитектура параллельных вычислений CUDA от NVIDIA широко поддерживается библиотеками машинного обучения cuDNN, поэтому исследователи и разработчики систем искусственного интеллекта перешли на продукты NVIDIA, чем вызвали рост акций компании на 85% в 2017 году.
Например, университеты Флориды и Северной Каролины с помощью NVIDIA разрабатывают движок нейронной сети для моделирования в области квантовой механики.
Многие организации работают с картами GeForce и Titan из-за цены. GeForce GTX 1080 Ti стоила 699 долларов. Для сравнения, последняя карта Tesla V100, заточенная под ЦОДы, стоит около тысяч долларов. Добавленный пункт соглашения может стать препятствием для проведения исследований и разработки новых продуктов.
Но при всем при этом в NVIDIA отмечают, что изменения не коснутся тех исследователей и разработчиков, которые адаптируют продукты компании для некоммерческих целей и используют ускорители вне ЦОДов.
Альтернативные решения
Пользователи Reddit указывают на то, что запрет касается только софта, а не железа. Поэтому можно писать собственные драйвера и затем использовать видеокарты от NVIDIA легально. Однако это сложно осуществить на практике, потому что ИТ-гигант не предоставил соответствующих спецификаций для железа (часть пользователей убеждена, что это вообще невозможно, так как контроллеры на всех картах NVIDIA не поддерживают ничего, кроме фирменных драйверов).
Ещё один вариант — использовать старые драйвера, на которые не распространяются изменения в новом лицензионном соглашении. Но в этом случае придется смириться с ограниченным уровнем поддержки.
Также резиденты Reddit отмечают, что стоит обратить внимание на проект ROCm (Radeon Open Compute) — open-source-платформу для высокопроизводительных вычислений на графических процессорах, которая не зависит от языка программирования. Платформа позволяет работать практически с любой видеокартой, в том числе с продуктами NVIDIA.
Это возможно благодаря HIP (Heterogeneous-Computing Interface for Portability) — диалекту С++, который упрощает преобразование приложений CUDA в портируемый код на С++. Инструмент Hipify автоматизирует процесс конвертирования, что позволяет запускать HIP-код на «железе» AMD (с помощью компилятора HCC) и NVIDIA (с помощью компилятора NVCC).
P.S. Материалы по теме из нашего блога на Хабре:
P.P.S. Материалы из Первого блога о корпоративном IaaS:
Комментариев нет:
Отправить комментарий