Skip to Content

Антон Кошелев, УНЦ ИИ УрФУ на онлайн-конференции Уральского клуба Цифровизации #UDM25_9 ИТОГИ 2025 года

Мы выкладываем записи куда придётся нна доступные видеохостинги и пока ещё Вы можете выбрать какой удобнее для просмотра.

Канал 
RuTube


Этот доклад

Основной отечественный видеохостинг.
(Мы это заслужили))...
Как то работает без всяких доступов.
простота в обмен на садистский интерфейс и ядовитую рекламу.  виде копии. 

Сообщество
Вконтакте


Этот доклад 

Группа в основной отечественной социальной сети, которая развивает бизнес-функции.
(Если не отменят бесплатный морковный сок) Лучшее из того, что есть "для невыездных". 

Канал
YouTube


Этот доклад

Недружественная, полная иноагентов и вредного контента, но самая развитая видеоплатформа, для тех, кто знает как оттуда смотреть полезные материалы.  

Расшифровка видеозаписи
Расшифровка сделана ИИ (а он ленивый, тупой рукожоп) и корректируется только силами и по решению докладчика. Пользуемся "как есть".

00:00

-- А у нас Антон Александрович готов ответить за университет уже? 
-- Да, здравствуйте.  Ну, не за все, только за наш.  И то не за весь. 
-- У нас выступал уже Антон Александрович.  Цензура, кто там, Аракчеев, злой Аракчеев никак не одобрил его доклад. Причем это превращается в тренд, потому что он сделал великолепнейший доклад, и я просто счастлив, буду упиздать, уже это Рудыня. Я помню, как ты мне предложил свое время.


00:29

лучше послушаю, просто честно, мне надо оттуда спарсить некоторые вещи, понимаешь, то есть я понял, думал, о классно, вот это войдет в золотой мой фонд.  Есть там, конечно, были и недоработки какие-то, что я видел, ага, вот тут я его сделаю. А вот были вещи, которые думал, блин, как у меня типа обошел,  как как в единоборствах, да, я уже не одобрил от цензура этот доклад. Где доклад СМЛ Екатеринбург? По правильному управлению. Надо Тане написать.


00:59

Ну, я все думал, дойду уроки, у меня же есть эти тайм-коды, которые надо повырезать, то есть эти неправославные высказывания про искусственный интеллект,  и мы опубликуем доклад Антона Александровича, который он нам делал про технологии искусственного интеллекта. А вот сейчас вот вопрос, это УРФУ, это же центр где-то Яндекс вдоль, это же вот эти стартапы, как диплом. У нас ЗБЕР вдоль.


01:26

Яндекс это соседи. Я уже вспутал в этом. Ну, просто классно, им классно, у них каждый раз кто-то платит за пиццу. В том числе я понял, почему Екатеринбург вот такая карма. Я думал два тренда, что здесь убили царскую семью и здесь поставили Ельцин Сантор. Теперь я понял, что третий удар по карме здесь пилят долями. 200 фрогеров в ПК.  И все они, есть там нет ни подепродакта, ни продаванов, там все пилят не саппорт, а там все пилят долями.


01:54

Хотя мне очень там понравилось, потому что кто-то перед этим буквально наговаривал на Тинькофф, то есть когда-то же была самая сильная. Мне там понравилось Тинькофф, с Берри тоже классно в смысле техно-тусовки.  Ну и еще у нас Антон Александрович имеет опыт шоу от «Старой пронки» в энергетике, где он тоже занимался тем же самым, как там,  AI, AI, и И, и И, и так дальше.


02:22

Так вот, ну я попросил его тоже выйти как бы из своих кругов и рассказать, как он видит тренды в цифровизации, то есть что было, что будет, на чем сердце успокоится. Пожалуйста, Антон Александрович.  Давайте начнем. Я действительно сегодня буду выступать с точки зрения университета, поскольку пока что меня основное место работы – это учебно-научный центр искусственного интеллекта.


02:57

А сегодня, по-моему, Контура какие-то сложности. Может быть. Мне кажется,  что интернет может у меня притормаживать.  Спасибо Игорю Вячеславовичу за приглашение. Такая интересная конференция. Интересно, полезно было всем послушать. Спасибо всем за доклады.  Я сегодня расскажу с точки зрения... Отвечу на вопросы, которые были обозначены у нас в программе мероприятия.


03:26

с точки зрения Уральского Федерального Университета, ну конкретнее вот Учебно-Научного Центра Искусственный Интеллект. Значит, какие у нас три главных успеха с нашей точки зрения мы можем отметить. Первый — это, собственно, то, благодаря чему появился этот Учебно-Научный Центр в Уральском Федеральном Университете, поскольку в начале года Минцифри выбрала 12 вузов для программы ТОПИИ и еще...


03:54

порядка 20 вузов для программы TOP IT. Выделило на это финансирование довольно значительное. Под это финансирование, под этот грант был открыт учебно-научный центр искусственного интеллекта. И основная задача программы при совместном участии университета и компании индустриальных партнеров за 4 года вырастить высококвалифицированные кадры для IT и для E.


04:23

Поскольку для программистов уровня стажер или джун,  в частности, радиофак научился выпускать больше тысячи в год, теперь, соответственно, запрос от индустрии был джунами рынок-носители, теперь не хватает медлов. Вот нас теперь новый вызов научиться за 4 года выводить на рынок труда не джуна стажера, а, соответственно, полноценного медла.


04:50

Ну, соответственно, что у нас отличает медла от джуна? По сути, два года опыта работы.  Поэтому мы как раз в рамках... У нас открыты два направления на радиофаке в рамках как раз Гранта ТОП ИИ, алгоритма искусственного интеллекта и прикладной искусственный интеллект,  где ребят обучают современным подходам работы и применении искусственного интеллекта.


05:18

различным отраслям.  в основном, поскольку у нас якорным партнером является Sber, то в основном применение в финтехе, в ритейле, но в том числе у нас есть и университете промышленный трек, поэтому у нас есть проекты, связанные с промышленностью.  У нас сейчас с Neuromus совместные есть студенческие проекты еще с рядом компаний и, соответственно,  как раз фокус


05:48

в том числе в этом гранте, ну и у нас в университете сейчас активно продвигается фокус на проектное обучение, когда студенты по сути с первого курса знакомятся со спецификой своей трудовой деятельности, со отраслевой спецификой различных компаний.  Со второго курса активно проходят стажировки,  активно каждый семестр реализуют командные проекты в командах по 6-7 человек, вот на конкретные темы.


06:17

интересным индустриальным заказчикам. Поэтому всех с удовольствием приглашаю. У нас в феврале будет очередная террация сбора тем проектов. Можно предлагать проекты студентам, если соответственно они заинтересуются,  то милости просим. Это хороший вариант попробовать какие-то новые идеи, протестировать гипотезы, которые, может быть, у вас не хватало времени,  рук или даже компетенций.


06:46

соответственно,  эти вещи протестировать на базе университета. Ну и с другой стороны,  уже студентов познакомить со спецификой вашей отрасли и за 2-3 года подготовить квалифицированные кадры к выпуску. Ну дальше, если они пойдут в магистратуру,  то сейчас будет управленческая магистратура. Сразу, как говорится, за 2 года дорос до медла, потом еще за 2 года дорос до темляда. И готовый спецначальник отдела получается.


07:16

Второй успех, на мой взгляд, это то,  что в конце ноября нас правительство подписало постановление о том,  что IT-компании для того, получить аккредитацию, в том числе, должны будут устроить совместное финансирование для университетов на 3 % от сэкономленных налогов денег.  Эта программа позволяет обратить взгляд компании на университеты.


07:44

Ну и, соответственно, чтобы не просто деньги куда-то ушли на непонятные цели, а, соответственно, университеты готовы к сотрудничеству,  к диалогу. Соответственно, мы можем адаптировать потребности компаний,  внедряя их в учебный процесс. Ну и, помимо этого, у нас в УНЦ есть лаборатории,  которые реализуют РНГ-проекты как связанные с агентными системами на основе искусственного интеллекта, компьютерного зрения, обработкой текстов. Соответственно, тоже...


08:14

в рамках, в том числе, такого финансирования, можем организовать совместные исследования, если кому-то это будет интересно.  Ну и, в принципе, по сути, это постановление ложится в основу восстановления отраслевых институтов на базе лабораторий и кафедр университета, которых, как говорится, сейчас и не хватает.  тут один из вопросов был на конференции, почему у сильная фундаментальная наука и...


08:43

не такое сильное приложение в отрасли. Как раз потому, что нас исчез отраслевых институтов, которые являлись проводником технологий, от фундаментальной науки к промышленности. Вот как раз это постановление может являться первым шагом к восстановлению подобных практик.  И третий, на мой взгляд,  успех, это то,  что как раз в конце октября СБЕР провел


09:12

масштабную конференцию iJourney по искусственному интеллекту. По сути, была выставка достижений Сбера в области искусственного интеллекта и не только.  И робототехника была продемонстрирована,  и как раз были продемонстрированы решения и в области ERP, и в области оптимизации процессов компаний.  И, соответственно, Сбер выложил в открытый доступ все свои наработки. Во-первых, вышли новые версии и GigaChat, и Кандинского.


09:42

и других моделей Сбера, и в открытый доступ Сбер выложил все свои наработки, включая, например, GigaAdjents.  Это вот решение,  которое позволяет, в том числе, локально развернуть у себя систему, в которой уже есть большой набор преднастроенных агентов и субагентов,  которым можно подключать большие языковые модели как удаленно, так и развернутые локально, что как раз является одной из удобных платформ для


10:12

внедрение уже не просто больших языковых моделей у себя, а, соответственно, мультиагентных систем на основе этих языковых моделей. Когда по промту сам агент понимает, что нужно делать,  вызывает внутри себя субагенты под конкретные задачи, или генерирует код, или анализирует какие-то данные, или анализирует изображения, или генерирует текст. В зависимости от задачи, соответственно,  выбирается нужный инструментарий.


10:42

Шуруповерту есть универсальный шуруповерт, большая языковая модель, и она выбирает разные насадки, как с ними работать.  Следующий вопрос был три главных проблемы 25 года.  На наш взгляд,  исходя из общения с компаниями партнеров, исходя из запросов компаний, которые приходят к нам на проектный практику, исходя из общения на тех же конференциях и общения со студентами...


11:11

Первое, что кажется, это завышенное ожидание пользователей от искусственного интеллекта. Когда люди пишут там, им сказали, что это интеллект, соответственно, они пишут ему,  сделай нам хорошо,  кратко, небольшой промд в общих чертах о том, что они хотят получить,  и соответственно, моделям также кратко в общих чертах отвечают. Ну, соответственно, людей возникает разочарование и тезис, что эта штука не работает.  Это вот я слышал и от руководящих начальников,  например.


11:40

на РЖД заявляли, что нейросети летом, например, плохо справлялись с подсказками по регламенту на железных дорогах,  плохо справлялись с подсказками по регламентам на промышленных предприятиях, но с другой стороны, нас рак системы развиваются,  сейчас граф-рак активно внедряется при правильном использовании и правильной настройке понимания того, что искусственный интеллект может, что не может написание правильных системных промтов. В принципе,


12:11

как тут тоже уже говорили, искусственный интеллект показывает довольно хорошие результаты. Следующая проблема — это рост требований к безопасности. То есть если раньше у нас кибербезопасность определялась веб-приложениями,  основной проблемой в кибербезопасности — это был выход в интернет и доступ к интернету, когда можно было скачать не тот вредоносный файл или он мог...


12:39

можно было организовать DDoS атаку с помощью алгоритмов. Теперь же, как говорится, хакеры вышли на новый уровень. На вооружении пентестеров оказался рель, обучение с подкреплением. Если раньше это делали люди, подбирали ключи к вашим системам, то теперь это делают опять же агентные системы, умные боты, которые гораздо изобретательнее и, собственно, работают 24 на 7.


13:07

их работу можно распараллелить и, соответственно, подбор возможных уязвимостей только усилился. Соответственно,  и активно внедряется с точки зрения компаний, которые внедряют компьютерную безопасность, аналогичный подход,  когда деление Red Blue Team,  сами компании,  занимающиеся кибербезопасностью,  сами разрабатывают агентов и...


13:36

используют обучение с подкреплением опять же для поиска уязвимости. Ну, то есть, по сути, делают то же самое, что и хакеры, только потом результат работы другой.  Ну плюс тоже летом, где-то в конце лета была новость, что вирусы вышли на новый уровень, что если раньше вирус, это нужно было скачать какой-то исполняемый файл, который должен был потом как-то у вас запуститься, то теперь вам отдельно на компьютер скачивается большая языковая модель.


14:06

какая-нибудь не очень тяжелая, которая в принципе вполне доступна и является разрешенным и сертифицированным программным обеспечением. Потом вам на компьютер скачивается текстовый файл, какой-нибудь вордовский, который просто содержит некоторые тексты никакого программного кода. То есть опять же он проходит стандартные фильтры защиты,  интернет-защиты. Ну потом просто в этой большой языковой модели запускается этот промд,  и большая языковая модель превращается в супер...


14:35

вредоносного, высокоинтеллектуального агента, который сканирует вашу систему, находит в нее извимости и отправляет их зломышленникам. А может быть, и сам по промд начинает выполнять некоторые требования.  Плюс по-прежнему высока вероятность промдинъекций. Если раньше нас основной проблемой доступа к данным были SQL инъекции,  банальные дырки в...


15:02

доступах через адресную строку в браузере, то теперь еще появился риск промдинъекции, когда мы с помощью ответа на запросы интеллектуального агента, по сути, туда вшиваем команду на перехват его управления.  Вроде бы этим постарались тоже компании, которые разрабатывают большие языковые модели, борются, но при этом прогресс подбора не стоит на месте.


15:30

при членовании спецсимволов языков, всё ещё можно довольно успешно вскрыть языковую модель и обойти её основные ограничения. Ну и тут же социальный инжиниринг в полный рост работает. И третья проблема – это ограниченный доступ к зарубежным решениям. То есть всё-таки у нас большинство наиболее хорошо работающих, показывающих высокую эффективность решений.


15:56

частности, по написанию кода, по генерации изображений,  по работе и тому же Deep Search или Deep Think, они находятся за рубежом и обычные в платной версии работают, то, соответственно,  отечественные решения даже в платных версиях пока что на несколько месяцев все-таки отстают от зарубежных аналогов, поэтому если нужно оставаться в тренде,


16:26

Если хочется пользоваться качественным копилотом для написания кода, генерации презентаций или генерации текста или каких-то блок- схем, все еще нужно использовать зарубежные решения. Тут пока что нас проблемы с импортозамещением довольно большие. Следующий вопрос у нас был три главных разочарования.  Первое разочарование – это то, что нейросети по-прежнему галлюцинируют. Причем...


16:53

Если летом казалось, что вроде бы какая-то проблема,  победим, и через пару месяцев они будут галлюцинировать меньше,  ну к концу года мы все понимаем, что они галлюцинируют больше.  И единственным решением является хорошо настроенный граф РАК-системы, который все еще требует высокой квалификации разработчиков, датасиентистов и довольно большой предварительной работы с теми данными,  которыми вы будете наполнять базу этих РАК-систем.


17:23

И второе разочарование — то, что лично моё, что Qend сильно испортился буквально на глазах. То есть еще в конце лета, начале осени,  он казалось, что вот-вот догонит чадж GPD и встанет по эффективности структурирования и анализу контента, станет в один уровень с клодом по качеству написанного кода. То вот в четвертом квартале после внедрения генерации изображений,


17:52

Quen стал жутко тормозить,  сильно тупить. и в общем,  то, что хорошо работало, по сути, сломали.  И приходится искать альтернативные решения.  И пока что бесплатная альтернатива Quen лично меня стал местраль, поскольку он, наоборот, стал показывать хороший результат и в написании кода, и в анализе. Либо Yandex GPT даже приходится периодически использовать, поскольку Yandex GPT 5 Pro тоже показывает хороший результат.


18:22

как когда-то показывал Квэн.  И третье разочарование – это скепсис к промд-инжинирингу,  что по сути мы все с вами понимаем, что искусственный интеллект – это инструмент.  Такой же IT-инструмент, соответственно,  просто научиться эффективно и грамотно использовать интерфейс этого инструмента. Основным интерфейсом его стал промд.


18:50

В концепции software 3.0 нас основной навык — это писать правильные промты и потом правильно оценивать результаты работы больших языковых моделей.  Но большинство пользователей по-прежнему это игнорируют, считают,  что банального легкого промта должно быть достаточно для того, чтобы нейросеть выдала хороший результат. И когда она этого не делает, они говорят, вот видите, эта штука совсем не работает. Хотя нужно просто...


19:16

подобрать хороший промд, подобрать правильное применение, может быть раздробить задачу на отдельные простые части, под каждую написать свой хороший промд, и у вас все заработает, если вы сложите это потом в одного работающего агента. Но, как говорится, это требует дополнительного навыка, квалификации,  времени, сил. И у большинства пользователей этого не находится. В результате нейросети, мне кажется, недооценены и недоиспользованы становятся.


19:45

Следующий нас пункт был три главных фичи на 2026 год, прогнозы на будущее.  вот я сужу по тем трендам конца 2025 года, которые мы наблюдаем. Мне кажется, что по крайней мере в первом полугодии у нас продлится, можно их смело туда экстраполировать.  Что будет во втором полугодии я пока вообще не стал прогнозировать, поскольку даже то, что мы наблюдали в апреле 2025 года, из апреля 2025 года сказать, как все будет выглядеть,


20:15

в августе или в октябре 2025 года было довольно сложно. Горизонт планирования сейчас существенно сократился.  Agile как раз набирает популярность. Причем не просто Agile, а MVP Agile, когда мы стараемся не просто малыми шагами двигаться, а еще и с минимальным вложением сил и ресурсов. И, соответственно, три главных тренда, которые мы видим уже сейчас, это


20:45

Переход от использования GPT в режиме простого диалогового агента к мультиагентным сложным системам, которые будут работать в полностью автономном режиме. есть у нас сейчас все крупные игроки предлагают так или иначе использовать их браузеры в качестве вот таких решений мультиагентов. Сбер выложил тоже свои GigaAgents. Мне кажется,  что следующий уровень автоматизации...


21:13

Если раньше человеку приходилось перекладывать результат работы модели в следующий промд, то теперь осталось это связать в единый конвейер,  поставить единому модель-супервайзер, который обыкнет выбирать направление, по которому ту или другую задачу надо отправить. есть... И, по сути, мы получим универсальное решение.  Следующий фича, который окажется полезный, это копилоты.


21:41

которые тоже активно внедряются.  Сейчас они появились везде, даже в PowerPoint,  в Word, в Excel.  есть, по-моему, уже только ленивый не поставил себе капилот.  У нас даже студенты пробуют сделать капилот для ng.  В принципе, тоже получается.  Капилоты становятся такой впечатлением, что уже скоро станут промышленным стандартом.  И наоборот, первый навык, которому нужно учить любого человека, работающего с той или программой, это как эффективно работать с капилотом.


22:11

Вот мы как раз на одном из курсов у нас на программах в университете прочитали как раз курс, когда мы студентов с первого курса их на одном предмете учат на питоне писать руками, а мы их на другом предмете учим наоборот.  Строчки кода не писать руками, а пользоваться капилотами, промтами и большими языковыми моделями. Ну дальше балансировать свои знания о разработке и то, что выдают большие языковые модели.


22:39

чтобы получить готовый работающий вариант.  И третья фича,  это все говорят о том, что нам нужен Edge AI для того, чтобы он автономно работал уже на малых устройствах, на мобильных телефонах, на WPLA, в автомобилях, на станках, для того чтобы не нужно было все время стабильное подключение к интернету, не нужны были такие сверхмощные...


23:05

вычислительные кластеры для того, чтобы обучить вашу локальную модель с вашей локальной рак-базой, а для того, чтобы это можно было использовать локально и, может быть, даже не обязательно на GPU, которые дорожают на глазах, а на обычных процессорах. То есть, по сути,  в эффективность работы больших языковых моделей мы уже, можно сказать, уперлись. есть, кривая насыщение выходит...


23:33

на свою горизонтальную часть,  и поэтому теперь можно переходить к оптимизации. К оптимизации как раз вычисленных ресурсов, необходимых вычисленных мощностей для того, чтобы выдавать то же самое качество работы искусственного интеллекта, но гораздо дешевле. Ну, как говорится, естественный следующий шаг развития. Следующий вопрос был три главных угрозы 1926 года. На мой взгляд,  то, что хакеры начинают использовать и агентов для атак.


24:02

Я приводил пример с тем, что можно скачать GPT агента, туда внедрить отдельно отдельно скачать вредоносный промд и потом их совместить. И у вас получится, по сути,  гримучая смесь.  Следующий это ИИ-мусор, то что большинство работников уже использует искусственный интеллект. Вот мы можем, как у нас, если переходить к паре менеджер-работник,


24:28

У нас есть пара, преподаватель-студент. То есть еще в сессию 2024 года студенты активно использовали нейросети для написания дипломов. В сессию 2025 года уже 95 % студентов использовали нейросети для написания дипломов. И уже преподаватели стали массово использовать нейросети для, по крайней мере, проверки дипломов. Появились проекты по нейронормоконтролеру. есть нормоконтроль отбирает кучу времени. Это довольно формальная...


24:59

и не очень высоко квалифицированная работа, требующая просто усидчивости и соблюдения правил. Вот как раз тоже у нас в университете тестировался инструмент интеллектуальный нормоконтроллер.  Ну и сейчас уже наоборот. Пришло понимание к тому, что если у студента есть доступ к интернету, то он точно с вероятностью 99.9.9 после запятой воспользуется услугами искусственного интеллекта. Поэтому, соответственно,


25:28

И сотрудники точно так же.  Поэтому все работы в условиях, где у сотрудника или студента или кого-то есть доступ к интернету, надо исходить из того, что он их будет делать с применением искусственного интеллекта, если это будет возможным.  И таким образом получается, что это новый вызов для менеджмента, поскольку нужно перестраивать прогнозирование трудозатрат, прогнозирование эффективности, прогнозирование качества.


25:56

Поскольку, как мы помним, нейросети по-прежнему галлюцинируют, далеко не все пользователи это понимают, не всегда у них хватает квалификации для того, чтобы отследить галлюцинацию, ну и соответственно, вас общий результат работы падает. Это вот новый челлендж для менеджеров.  И третья угроза – это исчерпание данных для обучения моделей, поскольку все данные, которые были сгенерированы не моделями на планете Земля, на них уже обучились модели, и, как говорится, надо еще.


26:25

И поэтому дальше модели начинают учиться на тех данных, которые генерированы модели, но это приводит к сильному байесу, поскольку, как мы помним, там есть галлюцинации, там есть стилистические смещения в сторону вот этого формального искусственного языка модели,  и, соответственно,  модели начинают больше на этом обучаться и все больше и больше задвигаться в эту сторону. Это тоже некоторые угрозы.  И три главных тренда, которые хочется отметить.


26:55

в 26-м году. Это переход к полностью автономным ИИ-агентам, которые уже будут большие задачи решать.  Летом люди уже пробовали доверить агентам разработку крупных приложений, что закончилось тем, что агент снес продовую базу данных.  Но, как говорится,  сейчас технологии безопасного использования таких агентов развиваются, и хочется верить, что в 26-м году это уже будет массово доступное решение, и оно будет, самое главное, безопасным.


27:25

качественным и безопасным. Это вот основное, на чем сейчас фокусируются разработчики.  Второй тренд — это то, что искусственный интеллект требует критического мышления. Как я сказал,  когда-то у нас появились автомобили, потом когда-то нас появился интернет,  и, как говорится,  стало... Нужно стало объяснять людям,  что не нужно верить и доверять слепо всему, что пишут в интернете.


27:54

много фальсификаций, то теперь точно так же нас массово появились большие языковые модели, и нужно людям рассказывать, что не надо слепо доверять выводу большой языковой модели, она галлюцинирует, применяйте критическое мышление,  заставляйте модель перепроверить и улучшить себя,  используйте перекрёстную проверку разными моделями, поскольку у них всё равно разные базы обучения, разные настройки, то есть всячески проверяйте результат работы.


28:23

Ну и, опять же, используйте критическое мышление для правильной постановки задачи. Сложные задачи декомпозируйте, учитесь писать правильные промты. Это, собственно, теперь полезный навык современного мира.  И третий тренд — это системное обучение и грамотности, который вот в том числе связан с авторем.  Когда-то нужно было массово осваивать,  всем становиться грамотным пользователем ПК, потом грамотным квалифицированным пользователем интернета.


28:52

Потом мы все с вами стали квалифицированными пользователями смартфонов. Теперь нам всем нужно стать квалифицированными пользователями больших языковых моделей.  В том числе я массово обучаю и студентов, и преподавателей,  и специалистов разных прикладных профессий к грамотному использованию больших языковых моделей в их профессиональной деятельности на курсах ДПО.


29:19

И одна из точек бифуркации.  Тут точек много,  поэтому одну главную я не выбрал,  поэтому решил это большая юмористическая часть моего доклада, поскольку нас все-таки новогоднее мероприятие. Как раз в сентябре американские ученые из Microsoft и Университета Maryland расширили свой до этого разработанный


29:50

метод оценки эффективности работы больших языковых моделей с задачами на длинных контекстах, вот их бенчмарк OneRuler, они его протестировали не на одном английском языке, а на 26 наиболее популярных языках в мире. Причём там были и языки с низкой частотностью.  И результат оказался ошеломляющим для всех, включая самих исследователей, ну как мы с вами понимаем.


30:19

Большая часть контента, на котором учились большие языковые модели, это английский.  Китайские языковые модели явно учились на большом китайском контенте.  а первое место по эффективности и точности ответов при работе с длинными контекстами занял польский язык.  У него средняя точность получилась 88 % на всех популярных моделях. Там было и Gemini, и Qwain, и DeepSic, и O4 GPT.


30:49

Чаджи Пити. есть там были все, в исследовании были все популярные модели.  Первое место занял в польский, на втором месте французский 87%, дальше там итальянский, испанский и уже замыкают топ-6 языков русский и английский, которые показали там 84 и 83,9%. То есть в отрыв небольшой, но в некоторых задачах может быть критическим, поэтому...


31:18

как показывает практика, чем точнее вы пишете промд, и чем больше язык, на котором вы пишете промд, позволяет вам выстроить более сложные конструкции, которые передают все особенности той задачи и все особенности того результата, который вы ожидаете от модели, все особенности контекста, который вы хотите ей передать, тем эффективнее модель выдает ей результат.  Поэтому отрыв, небольшой, английский язык по-прежнему можно использовать как основной рабочий.


31:48

Но при этом можно поэкспериментировать не только с русским, английским, но еще и с польским, французским, итальянским языках, посмотреть, вдруг пром на этом языке внезапно окажется на пару процентов в точности лучше.  Ну, опять же, если это актуально для ваших задач.  И, на удивление, китайский занял всего лишь 23 место. есть,  что сильно напряженный, если очень сложную задачу дать, дипсику, и он...


32:17

начнёт вам отвечать или QAnon на китайском.  И некоторые другие модели, от которых не ожидаешь, что же, если их сильно под напрячь могут начать отвечать не только на английском, но и на китайском.  Это ничего не значит. Промты на китайском пока что не очень эффективны. Ну, может быть,  опять же, учёные из Microsoft и Maryland не так хорошо писали промты на китайском, но с другой стороны, есть, у них в исследованиях есть фамилии, потому что они вроде должны такие промты писать довольно хорошо.


32:46

Ну и исходя из этой точки бифуркации,  хочется предложить следующее слово года. Совместить то, что нас польские промты эффективны, а ожидаются у нас полностью мультиагентные автономные системы. Вот меня такое предложение слово года.  Благодарю за внимание. Готов ответить на вопросы.  Благодарю. Очень интересно. Но слово года вообще великолепно.


33:15

Поляки вообще очень интересный культурный код, но времени жалко нет, как в другой раз обсудим.  Созоната туннездрава.  вот,  вопрос по теме. Вайк кодинг, кто лучше всего питонит? Какая модель?  Клод и курсор. Но джимминай, в принципе, по отзывам студентов стоит где-то на одном уровне.


33:44

Ну, я сам заметил, что в некоторых задачах на порядок Clot побивает Charge-5.  Самоклад не ходает, меньше врет и праймее идет к цели, чем Charge-5 ходит. Да-да-да. Для кода cursor это то, что надо. Clot и cursor. Хорошо. Если мы берем три направления разработка, тестирование, оптимизация.


34:11

Где важнее и где сложнее, где перспективнее? Как вот по этим векторам раскладывается вайп-кодинг?  Вайп-кодинг тоже такое слово,  немножко расслабляющее.  К концу 2025 года мне больше нравится термин промд-кодинг, поскольку у промд-кодинг занимает и усилий не меньше,  обычный кодинг,  и квалификацию тоже там нужно повышать со временем. Ну, вообще...


34:39

Промд-кодинг перевел написание кода из основного времени по написанию кода мы перешли к основному времени тестированию, отладке и исправлению кода. Поэтому, если раньше у нас программист и тестировщик это были две разные профессии, то теперь это одна.  Человек, который пишет промд, а потом верифицирует и отлаживает и чистит код, который нагенерировала модель. Благодарю, Антон Александрович. Спасибо.







Н

in UDM
Сергей Турусов, на онлайн-конференции Уральского клуба Цифровизации #UDM25_9 ИТОГИ 2025 года