Главное об ИИ: лидеры сменяют друг друга, а роботы продолжают учиться
Разработчики искусственного интеллекта (ИИ) в Новый год едва ли отдыхали. Оно и понятно: неделя паузы может повлечь за собой серьезное отставание в технологической гонке. Вот и вышло, что январь изобиловал заметными анонсами ничуть не меньше, чем самые насыщенные месяцы 2025-го. OpenAI продолжает превращать ChatGPT в «швейцарский нож», Google распробовала тактику конкурента и реализует потенциал по полной программе, а Microsoft, напротив, подрывает доверие к себе. Эти и другие главные ИИ-события января – в ежемесячном дайджесте «Профиля».
Посмотрев на успехи OpenAI в 2025 году, корпорация Google поняла, что без пулеметной очереди небольших анонсов в новой ИИ-реальности не обойтись. Сократив технологическое отставание от конкурента, поисковый гигант начал активное внедрение и доработку полезных для конечного пользователя сервисов.
[embed]https://profile.ru/scitech/iizumitelnyj-god-kak-nejroseti-za...[/embed]
Пожалуй, самый заметный анонс – (Personal Intelligence). Фактически это функция сбора и ИИ-анализа контекста (с разрешения пользователя) из флагманских сервисов Google: поиск, электронная почта, фотографии из медиатеки, история просмотров на YouTube. В результате ассистент Gemini дает ответы с учетом этой информации: подбирает шины для личного автомобиля (найдя его в галерее фото) или планирует отпуск, принимая во внимание (из почты) предпочтения и уже совершенные путешествия.
Пока браузер Atlas от OpenAI не набрал популярность, доработки Chrome оставляют ему все меньше шансов закрепиться на ПК пользователей. Следом за базовыми ИИ-функциями новое решение от Google получили Gemini 3 (актуальную флагманскую модель компании) и полноценное боковое чат-окно, в котором можно просить ассистента что-то сделать, например отправить письмо через Gmail, найти информацию на сайтах, сгенерировать картинку с помощью модели Nano Banana. Функционал Personal Intelligence в ближайшее время также будет встроен.
В поисковике Google доработан режим AI Overview («Обзор от ИИ») – информационный блок, генерируемый нейросетями при запросе. Он тоже теперь работает на Gemini 3, то есть быстрее формирует текст и сохраняет более длинный контекст. Отсюда и новая возможность вести диалог, например задавать уточняющие вопросы прямо в обзорном блоке.
Корпорация также представила универсальный коммерческий протокол (Universal Commerce Protocol, UCP). Он позволяет ретейлерам встроить свои предложения непосредственно в ИИ-сервисы Google. А для интеграции нейросетевых возможностей в онлайн-магазины анонсирована платформа Gemini Enterprise for Customer Experience – своеобразный «конструктор» ИИ-функций. Кроме того, корпорация доработала алгоритмы персонализированной рекламы: они будут учитывать пользовательский контекст, чтобы определять, когда именно и какую рекламу и предложения показывать тому или иному человеку.
[embed]https://profile.ru/scitech/podem-s-perevorotom-chem-grozit-k...[/embed]
Наличие огромной аудитории Google позволило корпорации заодно «пнуть» своего главного соперника. После того как OpenAI сообщил о запуске рекламы в бесплатном и бюджетном тарифах (последний – Go за $8 в месяц – также недавно представлен) ChatGPT, поисковый гигант не преминул заявить: в приложении Gemini рекламы не будет (про поисковик речи не шло).
А еще Google и Apple официально подтвердили, что в основе ассистента Siri нового поколения тоже лежат модели Gemini. Это значит, что миллионы пользователей iPhone, iPad и компьютеров Mac будут использовать ИИ-сервис на базе разработки Google (а не OpenAI или других конкурентов) – по крайней мере, следующие несколько лет.
Иными словами, не зря глава OpenAI Сэм Альтман в ноябре объявлял «красную тревогу» из-за роста активности Google: нововведения OpenAI на таком фоне выглядят слабовато. Но все равно заслуживают внимания: компания продолжает добавлять полезный функционал в ChatGPT, фокусируясь на конкретных запросах пользователей, что превращает сервис в своего рода «швейцарский нож» – универсальный инструмент для разных специфичных задач.
Так, появилась отдельная платформа для работы с научными текстами Prism. Она позволяет не только генерировать, редактировать и проверять научные статьи, но также искать нужную литературу, формировать и добавлять ссылки и библиографии, работать с формулами. Есть опция совместной работы над одним документом.
В тестовом режиме запущен сервис, помогающий следить за здоровьем, – ChatGPT Health. Он позволяет подключить к нейросетям трекеры здоровья (такие как Apple Health или фитнес-приложения), медкарту, результаты медицинских исследований и прочее. Пользователь сможет консультироваться с ИИ-ассистентом относительно результатов анализов, визитов к врачам (разумеется, сами врачебные консультации сервис не заменит), правильному питанию, тренировкам.
Без отдельного анонса OpenAI встроила в ChatGPT функцию переводчика. Визуально она очень похожа на аналогичный сервис от Google, но, с одной стороны, поддерживает меньше языков, а с другой – дает дополнительный ИИ-функционал. В частности, после перевода пользователь может доработать текст, допустим, адаптировать стилистику под определенную аудиторию.
Хуже всего среди крупных ИИ-амбассадоров дела идут у Microsoft. Начав первой развивать генеративные нейросети в партнерстве с OpenAI, к нынешнему дню корпорация стремительно теряет доверие пользователей и очки репутации.
Но сначала о позитивном: как и Google, Microsoft активно продвигается в сфере агентного ретейла. В январе она запустила Copilot Checkout – функцию покупки товаров в чате с ИИ-ассистентом без необходимости переходить на сайт магазина. Работает она на базе открытого агентного протокола ACP – его в октябре представила OpenAI совместно с финтех-компанией Stripe. Последняя – инфраструктурный партнер Microsoft в новом проекте. Кроме того, корпорацию поддержали PayPal и Shopify – крупные американские игроки в сегменте онлайн-ретейла.
Собственно, в свой основной софт – офисные приложения, почтовый клиент и другое – компания также продолжает внедрять сервис Copilot. Целый список местами непонятных нововведений был в конце января: там и агентные функции для различного софта без разбора, и голосовые интерфейсы, и чего только нет. Анонс встретил сопротивление со стороны пользователей – настолько сильное, что компании пойти на попятную: на следующий же день стало известно, что из некоторых приложений ИИ-функции будут убраны, а сам подход к их внедрению (насильная интеграция без разрешения пользователей) скорректируют.
Впрочем, есть у корпорации проблемы посерьезнее: последние обновления Windows 11 – актуальной ОС для ПК и одного из ключевых продуктов Microsoft – приводили к ошибкам и даже критическим сбоям. В некоторых случаях пользователи не могли открыть меню «Пуск» (важный элемент интерфейса), в других система и вовсе отказывалась загружаться. Причина тоже связана с ИИ: Windows теперь сильнее опирается на облачные сервисы для обработки интеллектуальных алгоритмов, и именно их сбой привел к печальным последствиям. В таком контексте прошлогодние заявления топ-менеджмента корпорации о том, что до 30% кода написано ИИ-алгоритмами, выглядят весьма дискредитирующе.
Следуя тенденциям глобального ИТ, производители оборудования охотно идут на поводу ИИ-разработчиков и создают для них все больше специализированного «железа». Это в числе прочего сформировало довольно жесткий кризис оперативной памяти, но коснулось и других индустрий.
На прошедшей в начале января выставке потребительской электроники CES-2026 одна из главных презентаций была проведена корпорацией Nvidia. Исторически ориентированная на геймеров, она в очередной раз продемонстрировала смену основного профиля: отказалась анонсировать новую флагманскую игровую видеокарту, целиком посвятив мероприятие ИИ-устройствам. Основным стала Vera Rubin – платформа суперкомпьютеров для корпоративных дата-центров.
[caption id="attachment_1818676" align="aligncenter" width="1200"] Президент и главный исполнительный директор Nvidia Дженсен Хуанг представляет графический процессор Rubin и центральный процессор Vera во время своего выступления на выставке CES 2026[/caption]
Raspberry, разработчик небольших аппаратных платформ Pi 5 для различного рода автоматизаций, плату AI HAT+ 2. Несмотря на то, что это второе поколение ИИ-девайса, оно впервые заточено именно под генеративные модели: в связке с Pi 5 позволяет локально запускать как языковые, так и мультимодальные нейросети. Шаг заметный для индустрии (Raspberry Pi – самая популярная в мире платформа для систем «сделай сам»), но эксперты говорят о слишком высокой цене ($130) при довольно серьезных ограничениях: только урезанные модели для запуска, невысокая мощность (3 Вт), наличие некоторых ошибок.
[embed]https://profile.ru/scitech/umnye-i-pushistye-roboty-ii-kompa...[/embed]
Также разработчики продолжают экспериментировать с девайсами, уже готовыми под ИИ-задачи по принципу «включил и используй». Компания DingTalk («дочка» китайского ИТ-гиганта Alibaba Group) представила DingTalk Real – вычислительную платформу, которая 24/7 может обеспечивать работу ИИ-агентов в контуре предприятия.
А американская Rabbit (разработчик не слишком популярного гаджета r1) Project Cyberdeck – своего рода ноутбук для вайб-кодинга, то есть написания кода с помощью LLM. Девайс, как и первый эксперимент стартапа, тоже довольно спорный: с учетом того, что он представляет собой урезанную версию ноутбука, а нейросети, вероятнее всего, будут подключаться через «облако», его преимущества по сравнению с обычным лэптопом в принципе неясны.
Если в софтверных задачах польза от ИИ уже ощутима, то с робототехникой все сложнее. Компании продолжают экспериментировать и даже изображают своего рода гонку: глава Tesla анонсирует работу тысячи гуманоидов Optimus на реальных производствах, китайские компании вроде Eyou Robot Technolog вторят и сообщают о том, что роботы уже начинают собирать компоненты для своих «собратьев», и так далее.
Вот только ключевая проблема – недостаточно продвинутые алгоритмы «физического ИИ» – пока остается острой, и корпорации бросают значительные силы на ее решение. OpenAI, которая раньше не демонстрировала большого интереса к сегменту робототехники, запускает специализированную лабораторию, предназначенную для обучения алгоритмов на живых примерах. Роботами удаленно управляют телеоператоры, что позволяет ИИ учиться, как и в каких ситуациях правильно себя вести.
Microsoft сфокусировалась на языке управления: новая модель Rho-alpha предназначена для преобразования голосовых команд в последовательный набор действий с помощью рук-манипуляторов. То есть просишь «достать яблоко», и модель формирует систему необходимых движений, чтобы выполнить конечную задачу с учетом контекста – физического окружения, расположения фрукта и прочего.
[embed]https://profile.ru/scitech/agenty-rasshiryajut-realnost-samy...[/embed]
То, что изначально софтверные компании сфокусировались на этом направлении, может выглядеть странно, но одна из самых значимых коллабораций, объявленная на CES-2026, помогает понять, откуда у них такой интерес. Boston Dynamics, входящий в число старейших разработчиков роботов-собак и гуманоидов, партнерство с ИИ-лабораторией Google DeepMind, чтобы актуальное поколение устройств Atlas работало на их генеративном софте. Подобное сотрудничество позволяет объединить сильные стороны каждого из участников (разработчика софта и оборудования, производителя), чтобы заработать на формирующемся рынке.