Детали успеха: как DeepSeek удалось обойти мощные ИИ-модели

08 апреля 2025 г. 643 просмотра 1 минута на чтение

Размер шрифта: А А А

2025 год начался с настоящего цунами в сегменте искусственного интеллекта.
После долгих обсуждений различных моделей, компании, такие как Google, Microsoft, Apple, Meta и, конечно, OpenAI, были потрясены появлением китайской компании DeepSeek, которая представила свою ИИ-модель и произвела фурор в отрасли.
Вопрос о том, как Китай смог выпустить DeepSeek с ограничениями, связанными с торговой войной с США и невозможностью приобретения мощных видеокарт от NVIDIA, стал актуальным. Тем не менее, DeepSeek заявила, что использует творческий подход, полагаясь на инфраструктуру на базе чипов H800 от NVIDIA и обучая свою модель более 2,7 миллиарда часов при стоимости всего 5,6 миллиона долларов. Это выглядит незначительно по сравнению с тем, что OpenAI потратила около 100 миллионов долларов на обучение GPT-4.