Самую большую и открытую для всех нейросеть YaLM 100B представили разработчики «Яндекса»
Опубликована одна из крупных мировых нейросетей разработки российской компании «Яндекс». Это GPT—подобная (Generative Pre—trained Transformer) сеть, названная разработчиком — YaLM 100B. Основная ее задача — генерация информации текстового содержания, а также её обработка как на русском языке, так и работа с английским словарным запасом. Информация опубликована на сайте компании «Яндекс».
Специалисты рассказали, что сеть полностью открыта, доступ к разработке абсолютно свободный. Масштаб характеристик YaLM 100В охватывает 100 млрд. показателей, это на целый класс выше всех действующих проектов обработки информации на русском языке. Решаемый круг задач обширный, основное направление — работа с языком на естественном уровне. Семейство YaLM использует языковые модели, предназначенные как для построения готовых текстов, так и генерации материала нового содержания.
Подбор материала идет по лингвистическим законам, с учетом базы знаний, накопленной и собранной нейросетью со всего мира. Алгоритмы формируют тексты разного плана и содержания: от поздравлений и стихов, до ответов на вопросы и многое другое. Более того, есть методы связанные с описанием характеристик товаров, идеально подходящие для кампаний рекламного характера, сюда же можно включить работу с видеоматериалом.
На всех этапах обучения сети применялись мощности суперкомпьютеров «Яндекса», характеристики которых уже оценены Восточной Европой. Текстовая база обрабатывалась YaLM 100B путем обзора открытых источников, а так же Сети интернет, включая русскоязычные ресурсы, а так же контент на английском языке.
Ранее ГЛАС сообщал, что новый веб-сервис «Яндекса» позволит работодателям быстро находить специалистов в области IT.