Добавить новость

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

В настоящее время проводятся новые исследования, посвященные проблемам и возможностям масштабирования систем машинного обучения, питающих модели ИИ, и их результаты довольно плачевны

Проводятся новые исследования проблем и возможностей масштабирования систем машинного обучения, лежащих в основе моделей искусственного интеллекта, но результаты довольно мрачные. Эксперты говорят, что у таких компаний, занимающихся искусственным интеллектом, как OpenAI, заканчиваются мировые (искусственные) данные для обучения текста. Модели, более продвинутые, чем нынешние, такие как GPT-5 или GPT-6, могут даже исчерпать доступные источники данных к 2026 году. Возникает вопрос: сможет ли ИИ продолжать развиваться без новых человеческих текстовых данных?

Последние достижения в области языкового моделирования в значительной степени зависят от больших объемов текста, написанного людьми, часто полученного из Интернета или архивов компаний. Фактически общедоступные текстовые базы данных содержат миллиарды слов с миллиардов веб-страниц. Тем не менее, недавние исследования показывают, что компании, занимающиеся искусственным интеллектом, сталкиваются с серьезной проблемой: истощением данных. Столкнувшись с потенциальными препятствиями на пути масштабирования больших языковых моделей (LLM), исследователь искусственного интеллекта Тамай Бесироглу сказал Associated Press: «Здесь есть серьезные узкие места".

«Если вы столкнетесь с ограничениями данных, вы не сможете эффективно расширить модель.

Обратите внимание: Учёные разработали революционную технологию для исследования египетских мумий.

А расширение модели, вероятно, является наиболее важным способом расширить возможности модели и улучшить качество результатов», — добавил он. Инструменты искусственного интеллекта также без разбора используют публичные онлайн-архивы, и это противоречивая тенденция в использовании данных, которая вызвала судебные иски. Так произошло, например, с издателем New York Times, который подал в суд на OpenAI за нарушение авторских прав.

К головокружительному снижению потока нового контента

Исследователи говорят, что если нынешние тенденции в развитии LLM сохранятся, модель сможет работать с набором данных размером примерно с все общедоступные текстовые данные в период с 2026 по 2032 год (или даже раньше, если модель будет переобучена) обучение. Кроме того, исследователи из аналитического центра Epoch AI в Сан-Франциско отметили в отчете, что объем текстовых данных, используемых только для обучения моделей ИИ, увеличивается примерно в 2,5 раза каждый год. Они также полагают, что крупные языковые модели, такие как GPT-4 от OpenAI и Llama 3 от Meta (которая считается экстремистской группировкой в ​​России и чья деятельность запрещена), могут выйти из строя в 2026 году.

Чтобы устранить это препятствие, другие исследователи изучают, как продолжить разработку языковых моделей после того, как наборы данных сгенерированного человеком текста будут исчерпаны. Они утверждают, что наиболее возможным решением является обучение языковых моделей на синтетических (сгенерированных) данных, что предполагает перенос обучения из областей, богатых данными. OpenAI, Google и Anthropic уже работают над этим решением.

Однако, согласно выводам ученых из Университета Райса и Стэнфордского университета, использование в этих моделях контента, созданного ИИ, приводит к значительному снижению качества генерируемого контента. Это может создать цикл самообмана и вызвать множество вопросов: смогут ли алгоритмы ИИ стать более эффективными, производя лучшие результаты с меньшим количеством данных.

«Я думаю, важно помнить, что нам не обязательно обучать все более и более крупные модели», — сказал Николас Паперно, исследователь искусственного интеллекта и доцент кафедры компьютерной инженерии в Университете Торонто. Тем не менее, результаты этого исследования подчеркивают важность продолжения исследований для измерения темпов роста эффективности данных, а также потенциальных улучшений, приносимых новыми методами.

Больше интересных статей здесь: Новости науки и техники.

Источник статьи: В настоящее время проводятся новые исследования, посвященные проблемам и возможностям масштабирования систем машинного обучения, питающих модели ИИ, и их результаты довольно плачевны.

 

Читайте на 123ru.net

Другие проекты от 123ru.net



Архангельск

Погиб глава архангельской пожарной охраны Димитрий Охрименко



Мир

Российская туристка впала в кому на отдыхе в Турции и попала в заложники






Новости 24 часа

Филиал № 4 ОСФР по Москве и Московской области информирует: Родители 240,5 тыс. детей в Московской области получают единое пособие



Game News

Warner Bros acquires MultiVersus devs as it shifts focus to free-to-play



Москва

Упавший со второго этажа в московском ТЦ мальчик сбежал из детского сада



News Every Day

Who is Ghetts and what character does the rapper play in Supacell?



Настроение

В горах Кавказа



Москва

В Москве рассказали о первых результатах программы подготовки школьников к ОГЭ



Майя Плисецкая

«Майя Плисецкая охраняет меня с небес»: Анастасия Волочкова разнесла подписчиков, которым не нравится её страсть к баням



Москва

Фестиваль военных духовых оркестров одновременно открылся в трех городах Поморья



ATP

Рублёв пробился в полуфинал турнира ATP в Умаге



Москва

В Москве состоялся фестиваль «ДэнсхелпФест»



Елена Веснина

Теннисистка Веснина показала свою форму на Олимпийские игры в Париже



Симферополь

Выставка-реклама «Галерея книжных новинок»



Москва

В Москве состоялся фестиваль «ДэнсхелпФест»



Москва

Сергей Собянин. Главное за день



Москва

Начальник Главного управления вневедомственной охраны Росгвардии вручил ключи от автомобиля многодетному отцу-росгвардейцу



103news.com — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 103news.com.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.

Другие популярные новости дня сегодня


Новости 24/7 Все города России





Топ 10 новостей последнего часа




Новости России

Что последует за повышением ставки до 18%: Решение ЦБ оценили "в полях"

Филиал № 4 ОСФР по Москве и Московской области информирует: С 1 августа Соцфонд увеличит страховые пенсии россиян

Упавший со второго этажа в московском ТЦ мальчик сбежал из детского сада

В столице РФ состоялся диалог на тему: «Углубление китайских реформ в новую эпоху»


Москва

«Норникель» внедрил решения на базе ИИ почти на всех производственных площадках






Rss.plus

Филиал № 4 ОСФР по Москве и Московской области информирует: Родители 240,5 тыс. детей в Московской области получают единое пособие

Столичные росгвардейцы задержали мужчину, подозреваемого в грабеже

Начальник Главного управления вневедомственной охраны Росгвардии вручил ключи от автомобиля многодетному отцу-росгвардейцу

Более 40 тысяч семей в Москве и области получают ежемесячные выплаты из средств материнского капитала

Moscow.media
Москва

Собянин рассказал о работе Фонда развития венчурного инвестирования



103news.comмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. 103news.com — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости

Владимир Высоцкий

Владимир Высоцкий: 10 редких фотографий




Спорт в России и мире

Алексей Смирнов – актер, которого, надеюсь, еще не забыли

Собянин: В «Коломенском» будет создано уникальное современное пространство

«Динамо» анонсировало матч с «Локо» в стиле одной из самых знаменитых миссий серии GTA

В погоне за миром: Россия примет участников исторической гонки


Елена Рыбакина

В России "отдали" Рыбакиной медаль Олимпиады-2024



Новости Крыма на Sevpoisk.ru


Москва

Сергей Собянин: К обустройству районов подходим комплексно



Частные объявления в Вашем городе, в Вашем регионе и в России