DeepSeek шокира експертите със своя евтин AI чатбот

DeepSeek шокира експертите със своя евтин AI чатбот

Китайският чатбот с изкуствен интелект DeepSeek успя да задмине ChatGPT и други конкуренти и да се изкачи до първото място по изтегляния в App Store в САЩ, Обединеното кралство и Китай. Популярността на приложението започна да нараства след като компанията пусна своя нов модел DeepSeek R1 на 20 януари – той може да разсъждава и е предназначен за решаването на сложни задачи.

Моделът е базиран на пуснатия през декември DeepSeek LLM V3, за който компанията твърди, че е равностоен на GPT-4o и Sonnet Claude 3.5 на Anthropic, а разработката му е струвала по-малко от 6 милиона долара. За за сравнение главният изпълнителен директор на OpenAI Сам Алтман заяви, че обучението на GPT-4 е струвало над 100 млн. долара. Твърденията на DeepSeek разбуниха финансовите пазари, което доведе до спад в цената на акциите на Nvidia.

DeepSeek твърди, че е имала нужда само от 2000 специализирани чипа от Nvidia за обучението на V3, което е много малко на фона на 16 000 или повече, които са нужни за тренирането на водещите AI модели. Засега всичко това не е потвърдено, но беше достатъчно да накара водещите разработчици и инвеститори да повдигнат въпроси за практиките на водещите AI компании, които залагат да високата изчислителна мощ.

Ако твърденията се окажат верни то експертите на DeepSeek са успели да намерят начин да се справят ограниченият достъп до AI чипове като следствие от американските търговски рестрикции за износ на такива технологии към Китай. Успехът на компанията оспорва и широкоразпространеното мнение, че САЩ е безпелационен лидер на AI сектора.

За да могат да продължат работа без постоянен приток на нови чипове за AI китайските компании споделят своята работа една с друга, а освен това експериментират за намиране на нови начини за трениране на моделите. Това на свой ред доведе до създаването на AI модели, които изискват много по-малко изчислителна мощ, а освен това са много по-евтини, което може да преобърне цялата индустрия.

Разбира се, тъй като става дума за китайска разработка, DeepSeek не дава отговори на въпроси, които засягат политическата обстановка в страната. Няма да ви отговори какво е станало на площад Тиенанмън през 1989 година, автономен ли е Тайван или пък защо в Китай е забранено споменаването на Мечо Пух и Си Дзинпин.

Източник: BBC, NYT


Втора употреба с гаранция