Новини
Търси

Нов китайски изкуствен интелект настига Anthropic и OpenAI на технен терен

Нов китайски изкуствен интелект настига Anthropic и OpenAI на технен терен

Откакто DeepSeek шокира пазарите в началото на миналата година с евтиния си, но мощен модел на изкуствен интелект, потребителите по целия свят са изправени пред избор: китайски предложения с по-ниски цени и по-малко възможности или OpenAI или Anthropic, в чиято разработка са вложени милиарди

Модел, наречен GLM-5.2 , пуснат миналия месец от базирания в Пекин стартъп Z.ai, може би най-накрая ще запълни тази празнина по отношение на западния интерес, предаде Ройтерс.
 
GLM-5.2 кара Силициевата долина да бръмчи със своите възможности за кодиране и агенти, или способността за изпълнение на сложни задачи с минимални подкани, които почти съперничат на водещите американски предложения на част от цената, в това, което някои експерти наричат ​​"мини момент на DeepSeek".
 
Той бързо се изкачи в класациите за употреба на платформи за разработчици на изкуствен интелект от трети страни, като OpenRouter, където сега се нарежда над моделите на Anthropic, докато ръководители от главния изпълнителен директор на платформата за облачни данни Snowflake Шридхар Рамасвами до рисковия капиталист Марк Андреесен хвалят способностите му.
 
"Вече имаме китайски модел с отворено тегло, който е толкова добър, колкото и наличните в момента модели на OpenAI и Anthropic", каза Дейвид Сакс, бившият цар на изкуствения интелект в администрацията на президента на САЩ Доналд Тръмп, миналата седмица, преди Вашингтон да вдигне ограниченията върху моделите Fable и Mythos на Anthropic във вторник.
 
Тези възможности поставиха модела GLM-5.2 на Z.ai в центъра на нарастващия дебат за това дали Китай най-накрая настига САЩ в надпреварата за изкуствен интелект, тъй като технологични ръководители предупреждават, че непредсказуемото регулиране на индустрията от страна на Вашингтон рискува да възпрепятства лидерството ѝ в граничните технологии.
 
"Това е само малко под Opus 4.8 (от Anthropic) и точно до GPT 5.5 (от OpenAI)", каза Сакс за GLM-5.2 в подкаста All-In, добавяйки, че „не можем да си позволим да правим неща, които забавят нашите компании“.
Ограниченията на Anthropic и забавеното публично внедряване на най-новия модел GPT-5.6 на OpenAI са подхранили глобалното търсене на китайския модел, според някои експерти.
 
"Международната общност на разработчиците все повече осъзнава, че разчитането единствено на собствени, базирани в САЩ API модели носи значителен риск", каза Брайън Це, основател и главен изпълнителен директор на Concordia AI, консултантска компания, базирана в Пекин, фокусирана върху безопасността на изкуствения интелект.
 
Положителният глобален прием на GLM-5.2 също предполага засилен интерес към по-евтино разработване с отворен код, тъй като бизнесите са засегнати от нарастващите и често непредсказуеми разходи за използване на изкуствен интелект за изпълнение на задачи, тъй като агентните инструменти с изкуствен интелект със затворен код консумират повече токени - единиците, използвани за измерване на използването на изкуствен интелект.
 
Z.ai, известна още като Zhipu AI, отказа коментар. Anthropic и OpenAI не отговориха веднага на исканията за коментар.
 
GLM-5.2 в момента заема пето място в класацията за интелигентност на големи езикови модели (LLM) на Artificial Analysis, която класира производителността по редица показатели, предназначени да измерват общите възможности, включително умения за разсъждение и кодиране. И е на второ място в класацията за front-end кодиране на Code Arena, измервайки колко добре моделите генерират уебсайтове и front-end приложения, като същевременно работи на приблизително една шеста от цената на затворени модели за границата на САЩ като Claude и серията GPT.
 
Z.ai не е разкрила колко е похарчила за разработването на GLM-5.2.
 
В отговор на Илон Мъск в X миналия месец, основателят на Z.ai Танг Джие заяви, че китайският стартъп може да създаде модел, сравним с Fable на Anthropic, преди първото тримесечие на следващата година.
 
"Промяната, която GLM-5.2 носи, е, че моделът с отворен код се превърна в продукт „plug-and-play“, готов за употреба", каза Тиежен Уанг, бивш ръководител за Азиатско-тихоокеанския регион в Hugging Face, стартираща компания, която служи като център за разработчици, работещи с модели с отворен код.
"Просто внедрявате модела и без да правите никакви сложни фина настройка на системите, той е в лесно използваемо, готово за употреба състояние. Това драстично намалява бариерата за навлизане при приемането на отворен код."
 
Една от основните пречки пред мащабното внедряване на GLM-5.2 остават опасенията за сигурността на данните, които ограничават използването на китайски модели от американските предприятия, особено в регулирани индустрии като банкиране и киберсигурност. Миграцията и надграждането на корпоративните системи с изкуствен интелект обикновено отнемат няколко месеца, каза Уанг.
 
"Видях някои дискусии сред европейските компании относно това дали може да се използва в корпоративни условия", каза Уей Сун, главен анализатор на изкуствен интелект в Counterpoint Research.
 
"В ЕС и САЩ някои клиенти, партньори и регулирани индустрии може просто да не желаят да приемат китайски модели в своя ИИ стек, независимо от техническите характеристики или цената."
 
Доклад от по-рано тази година на неправителствената организация RAND, отваря нов раздел, базирана на данни за трафика на уебсайтове в 135 държави, установи, че глобалният пазарен дял на китайските LLM компании е скочил до 13% от 3% през двата месеца, след като DeepSeek пусна своя модел R1 през януари миналата година. Пускането на пазара предизвика глобален спад в технологиите, защото контрастираше с ниската цена на DeepSeek с огромните разходи за инфраструктура за изкуствен интелект другаде.
 
Увеличението на използването на LLM в Китай е най-силно изразено в развиващите се страни и тези с тесни политически и икономически връзки с Пекин.
 
Някои експерти заявиха, че опасенията относно безопасността на китайските модели с изкуствен интелект са преувеличени, твърдейки, че използването им на американски облачни доставчици или на собствени сървъри на компанията гарантира сигурността на данните. Докато големите корпорации бавно мигрират, технологичните стартиращи компании и малките и средни предприятия се движат много по-бързо.
 
"Разработчиците са склонни да се интересуват по-малко откъде идва даден модел, отколкото дали работи, колко струва и дали могат да го внедрят или да имат достъп до него надеждно", каза Пое Джао, технологичен анализатор за Китай и основател на бюлетина Hello China Tech.
 
"Вероятният модел е частично маршрутизиране, а не заместване на OpenAI или Anthropic за една нощ. Така че да, това е мини момент на DeepSeek, но в по-тесен, ориентиран към разработчиците смисъл."
Последвайте Таралеж в Google News

Водещи