Рекордная производительность: 17 000 токенов в секунду у нового решения от стартапа Taalas

watch 8s
views 2

15:09, 20.02.2026

Недавно стартап из Канады Taalas сообщил о своем первом продукте – чип HC1 c Llama 3.1 8B. Особенность подхода компании состоит в том, что модель не загружается в память, а непосредственно впаивается в кремний на этапе производства. Вследствие чего можно достичь рекордного результата в 17 000 токенов в секунду на одного юзера. Такой результат почти в 10 раз быстрее решений на GPU, а также достигается значительная экономия энергии и минимизируется стоимость производства.

Компания Taalas

Стартап основали Любиша Байич бывший директор проектирования интегральных схем в AMD, его жена Лейла Байич (бывший технологический менеджер и инженер в AMD, ATI, Altera), и Драго Игнятович (бывший директор по ASIC-дизайну в AMD).

Основной подход компании можно назвать – тотальной спецификацией. Для каждой модели, компания планирует производить отдельный чип. Микросхема будет состоять приблизительно со 100 слоев и лишь 2 верхние будут кастомизированны нужным образом в них встраивается mask ROM recall fabric. Таким образом можно будет выпускать чип за 2 месяца вместо 6. Также вычисления и память будут объединены на одном кристалле.

На данном этапе такая агрессивная квантизация снижает качество если сравнивать с GPU-бенчмарками. Стартап признает этот факт, потому и позиционирует продукт как бета-сервис. Минимальная гибкость чипа сохраняется из-за возможности дообучения через LaRA-адаптеры и наличие контекстного окна.   

Компания привлекла инвестиций на суму $200 млн и планирует вскоре выпустить новый чип среднего размера, а ближе к концу года возможен запуск на платформе HC2 передовой LLM. 

Надеемся, статья оказалась полезной - а как вы считаете? Поставьте лайк и подпишитесь на наш блог, чтобы получать больше практических советов и последних новостей о технологиях от HostZealot.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-10%

CPU
CPU
10 Epyc Cores
RAM
RAM
64 GB
Space
Space
400 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 65536 Linux

£ 118.02

£

При оплате за год

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 32768 Linux

£ 61.4

£

При оплате за год

-29.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
2 TB
KVM-SSD 2048 Metered Linux

£ 14.81

£

При оплате за год

-13.1%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 512 HK Linux

£ 6.1

£

При оплате за год

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 4096 Windows

£ 15.77

£

При оплате за год

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

£ 60.97

£

При оплате за год

-5%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 1024 Windows

£ 10.54

£

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 8192 Linux

£ 22.95

£

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 8192 Windows

£ 25.25

£

При оплате за год

-4.5%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 4096 Windows

£ 14.71

£

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.