Добавить новость

Следствие ввели: «ИИ-детектив» разберется со сложной задачей при нехватке данных

Российские специалисты разработали метод, который позволяет системам искусственного интеллекта делать выводы и принимать решения при недостатке данных. Предложенный учеными из Казани способ помогает максимально быстро извлекать из массива уникальную информацию. В частности, этот метод уже применили для оценки качества питьевой воды по небольшой выборке результатов анализа крови детей. По словам специалистов, это позволило принять меры для улучшения качества воды. О том, как работает российская новация, — в нашем материале.

Почему ИИ ошибается при недостатке данных

При недостатке информации вычислительные модели на основе искусственного интеллекта часто выдают недостоверные результаты. Это происходит потому, что они «мыслят» не критически, а ищут статистически наиболее вероятные ответы. Когда данных не хватает, нейросети пасуют.

Решая эту задачу, ученые из Казанского национального исследовательского технического университета им. А.Н. Туполева — КАИ разработали новый способ построения таких моделей, который основан на внедрении «детективных» методов в работу ИИ.

— На практике есть задачи, где получение сведений связано с ограничениями физического, юридического и иного рода. Например, это относится к персональным данным, — рассказала один из разработчиков, профессор кафедры прикладной математики и информатики КНИТУ-КАИ Светлана Новикова. — Также некоторые материалы тяжело получить в силу их труднодоступности. В частности, с глубин океана или с поверхности других планет. Кроме того, зачастую построение моделей затрудняет слабое понимание взаимосвязей, нехватка подробностей или измерений.

В таких случаях, пояснила она, ИИ заполняет пробелы, генерируя новые данные на основе тех, которые есть в наличии. Чем их меньше, тем выше вероятность искажения итоговых выводов. Поэтому при дефиците информации предложенный подход ориентирован на то, чтобы заставить систему действовать подобно сыщику, который задает вопросы и строит логические цепочки, выявляя скрытые связи.

Фото: КНИТУ-КАИ

По словам ученого, принцип работы модели построен на идее резонанса. Когда в систему поступают сведения, она сравнивает их с шаблонами, которые хранятся в памяти. Если они похожи, то возникает «созвучие», и поступившие данные относят к тому же классу. Если сходства нет, то новая информация сама становится шаблоном. Улучшение, которое внесли специалисты КНИТУ-КАИ, заключается в способе оценки уникальности данных.

— Как правило, расширение выборки желательно и полезно для повышения точности модели. Однако в случае с редкими сведениями добавление в набор новой информации нужно тщательно взвешивать, поскольку даже единичное измерение может привести к разбалансировке модели. Решение о том, следует ли их включать в систему, принимается путем дополнительной экспертной оценки, — сообщила Светлана Новикова.

Для этих целей, пояснила ученый, система, распределяя информацию по классам, использует одновременно множество признаков, которым присвоены разные «веса». Если нужный «вес» не набирается, это значит, что «новичок» выбивается из занесенных в память модели шаблонов.

Предложенный подход позволяет не только повысить точность модели, но и дает возможность человеку проследить процесс принятия ИИ-решений. Это важно для повышения доверия к подобным системам.

Какой следующий шаг в развитии искусственного интеллекта

— Новые алгоритмы продемонстрировали эффективность при решении практических задач. К примеру, их применили для анализа содержания цинксодержащих соединений в крови детей в возрасте от года до 14 лет в Казани. Цель исследования заключалась в том, чтобы установить взаимосвязь между местом проживания, качеством питьевой воды и возможными угрозами для здоровья, — сообщила Светлана Новикова.

Она уточнила, что в системы водоснабжения цинк может попадать из-за загрязнения источников питьевой воды стоками промпредприятий или при длительном контакте воды со старыми оцинкованными трубами. Содержание металла выше допустимых норм представляет опасность здоровью людей.

По словам специалиста, всего было исследовано 240 проб с обезличенными данными. При этом, несмотря на маленькую выборку, предложенный метод позволил построить точные модели и выявить взаимосвязи содержания цинка в организме детей и местом их проживания.

— Проблема дефицита данных — одна из самых острых в современной прикладной аналитике. Есть области, в которых далеко не всегда есть «миллионы наблюдений». Например, медицинские исследования, экология, промышленность, космос, редкие события, персональные данные, — рассказала «Известиям» руководитель Центра искусственного интеллекта Сибирского федерального университета Анна Пятаева. — Как только выборка становится разреженной, классические подходы машинного обучения «сыпятся». И это видно в любой отрасли. В частности, такой пробел характерен и для популярных чат-ботов с искусственным интеллектом.

Она добавила, что сейчас с ограниченными наборами данных работают в основном исследовательские лаборатории и специализированные команды. Внедрение таких инструментов в широкий доступ ускорит развитие алгоритмов искусственного интеллекта. По сути, это следующий шаг — переход от «моделей для всего» к моделям, которые способны работать там, где данных объективно мало. И рынок для таких решений уже формируется.

В свою очередь, научный директор Института искусственного интеллекта МФТИ Юрий Визильтер отметил, что глубокие нейронные сети начинают устойчиво обучаться и работать там, где есть хотя бы десятки тысяч примеров. Лучше, конечно, еще больше — сотни тысяч и миллионы примеров. Поэтому в области малого числа примеров имеется практически важный пробел, который должны заполнить специальные методы.

— Достоверность моделей сильно зависит от качества исходных данных и корректности самих моделей. На малых выборках возрастает риск переобучения — когда ИИ сконцентрирован не на анализе и обобщении информации, а на «запоминании». Также малые выборки зачастую недостаточно репрезентативны, — сообщил старший научный сотрудник группы «Мультимодальные архитектуры ИИ» лаборатории «Сильный ИИ в медицине» Института AIRI Александр Нестеров.

По его словам, ИИ-инструменты для анализа небольших выборок особенно востребованы при работе с корпоративными данными.

Читайте на сайте


Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. Абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Казани

Ria.city
Музыкальные новости
Новости Казани
Экология в Татарстане
Спорт в Татарстане
Moscow.media









103news.com — быстрее, чем Я..., самые свежие и актуальные новости Казани — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 103news.com.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Казани или других населённых пунктов Татарстана мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Казани можно самостоятельно через форму.

Другие популярные новости дня сегодня


Новости 24/7 Все города России



Топ 10 новостей последнего часа в Казани и Татарстане



Rss.plus


Новости Казани







Rss.plus
Moscow.media


103news.comмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости




Спорт в Татарстане



Новости Крыма на Sevpoisk.ru




Частные объявления в Казани, в Татарстане и в России