Что нового

Компьютерный форум ПМР. Обсуждение компьютерного железа.

Присоединяйтесь к нам сейчас, чтобы получить доступ ко всем нашим функциям. Для этого Вам необходимо зарегистрироваться, чтобы войти в систему. Это делается легко, быстро и абсолютно бесплатно.

Задать вопрос

Создавайте темы, задавайте вопросы и получайте ответы от нашего сообщества

Отвечать

Комментируйте, отвечайте на вопросы и станьте экспертом в своей теме

Связаться с персоналом

Наши специалисты готовы ответить на ваши вопросы

Прорыв Google в ИИ усилил давление на акции производителей памяти

djon

Тутошний
Команда форума
Регистрация
23.11.2009
Сообщения
6 488
Реакции
148
Баллы
63
Местоположение
г.Тирасполь
Представленный Google метод сжатия TurboQuant усилил давление на акции производителей памяти в Азии и США. Инвесторы опасаются, что технология, способная, по утверждению компании, в 6 раз сократить необходимый для работы больших языковых ИИ-моделей объём памяти, в перспективе ослабит спрос на микросхемы памяти, ставшие ключевым компонентом ИИ-инфраструктуры.

proryv-google-v-ii-usilil-davlenie-na-aktsii-proizvoditelej-pamyati-main.jpg

Источник изображения: BoliviaInteligente / unsplash.com
В четверг в Южной Корее акции SK Hynix и Samsung Electronics, двух крупнейших в мире производителей памяти, снизились на 6 % и почти на 5 % соответственно. Акции японской Kioxia, выпускающей флеш-память, упали почти на 6 %. В США в среду снизились в цене акции Sandisk и Micron Technology. В четверг на предварительных торгах в США бумаги обеих компаний также оставались в минусе.

TurboQuant сокращает объём кэша ключей и значений — блока, где хранятся результаты прошлых вычислений ИИ-модели, чтобы не выполнять их повторно. Цель технологии — повысить эффективность ИИ-моделей, что остаётся одной из ключевых задач ведущих исследовательских лабораторий. Опасения инвесторов связаны с тем, что память остаётся критически важным компонентом для обучения ИИ-моделей Google, OpenAI и Anthropic. Снижение потребности в памяти при обучении ИИ может, по их оценке, замедлить рост спроса на специализированные микросхемы.

Глава Cloudflare Мэттью Принс (Matthew Prince) заявил, что возможности дальнейшей оптимизации ИИ-инференса по скорости, использованию памяти, энергопотреблению и эффективности использования ресурсов в многопользовательской среде остаются значительными. Аналитик SemiAnalysis по рынку памяти Рэй Ван (Ray Wang) не связал исследование Google с неизбежным сокращением потребности в чипах. Он заявил: «Когда вы устраняете узкое место, вы делаете аппаратную платформу для ИИ более производительной. И обучаемая модель в будущем станет мощнее. Когда модель становится мощнее, вам требуется более совершенное оборудование, чтобы её поддерживать».

Несмотря на снижение котировок в четверг, долгосрочную поддержку рынку памяти продолжают обеспечивать высокий спрос и дефицит предложения. Это сочетание уже привело к росту цен на память до беспрецедентных уровней и поддержало прибыль Samsung, SK Hynix и Micron. За последний год акции Samsung выросли почти на 200 %, а Micron и SK Hynix — более чем на 300 %. По оценке аналитиков, динамика акций производителей памяти на этой неделе в значительной степени была обусловлена фиксацией прибыли.

Руководитель исследований технологического сектора Quilter Cheviot Бен Баррингер (Ben Barringer) заявил CNBC: «Акции компаний из сектора памяти уже показали очень мощный рост, а сам этот сектор отличается высокой цикличностью, поэтому инвесторы и раньше искали поводы частично сократить позиции. Инновация Google TurboQuant усилила давление, однако это эволюционное, а не революционное изменение. Она не меняет долгосрочную картину спроса в отрасли. На рынке, уже настроенном на снижение риска, даже инкрементальное развитие может быть воспринято как сигнал сократить позиции».

Источник: 3dnews.ru
 

qwertyqwerty

Well-known member
Регистрация
01.04.2015
Сообщения
1 522
Реакции
92
Баллы
48
Я бы не спешил записывать это в «начало конца» для производителей памяти.

Во-первых, сама идея вроде TurboQuant — это классический пример того, как оптимизация сдвигает узкое место, а не убирает потребность в железе. Да, KV-кэш можно ужать в 6 раз, но что делают разработчики дальше? Правильно — увеличивают контекст, усложняют архитектуру, поднимают качество. В итоге экономия довольно быстро «съедается» новыми аппетитами моделей.

Во-вторых, речь ведь в основном про инференс. А основной жор памяти по-прежнему остаётся в обучении (особенно если смотреть на multi-trillion параметров и MoE-подходы). Там любые оптимизации тоже приводят не к снижению закупок, а к масштабированию задач.

Плюс есть ещё важный момент: эффективность = доступность. Если такие методы реально удешевляют запуск LLM, это расширяет рынок — больше компаний смогут позволить себе свои модели. А значит, в абсолютных цифрах спрос на память может даже вырасти, несмотря на снижение «на одну модель».

Скорее похоже на типичную реакцию рынка:

  • был перегрев → ищут повод фиксировать прибыль
  • появилась новость → усилила движение
  • дальше всё вернётся к фундаменталу
Интереснее другой вопрос:
если подобные методы станут стандартом, не приведёт ли это к смещению спроса с «сырого объёма памяти» в сторону более быстрой и энергоэффективной (HBM, кастомные решения под AI)?

Вот там, как по мне, и будет реальная борьба между теми же Samsung, SK Hynix и остальными.
 

djon

Тутошний
Команда форума
Регистрация
23.11.2009
Сообщения
6 488
Реакции
148
Баллы
63
Местоположение
г.Тирасполь
Согласен, тут классическая история «сдвинули узкое место — получили новый рост требований». Рынок, как обычно, реагирует линейно: услышали «в 6 раз меньше памяти» → значит спрос упадёт. На практике всё почти всегда наоборот.

Я бы ещё добавил пару моментов.

Во-первых, такие оптимизации редко остаются «бесплатными». Сжатие KV-кэша — это почти всегда компромисс: либо дополнительная вычислительная нагрузка, либо усложнение пайплайна. А значит:
— либо растёт нагрузка на GPU/ускорители
— либо увеличиваются требования к пропускной способности и латентности

И в итоге мы просто переносим давление с объёма памяти на другие компоненты системы.

Во-вторых, сейчас вся индустрия ИИ живёт по принципу: «появился запас → его сразу съели». Освободили память? Отлично, значит:
— увеличиваем контекст
— держим больше пользователей одновременно
— добавляем новые фичи (агенты, мультимодальность и т.д.)

То есть экономия превращается не в снижение затрат, а в рост качества/нагрузки.

По поводу HBM — вот тут, мне кажется, ты попал в точку. Вопрос уже не столько «сколько памяти», сколько:
— какая у неё пропускная способность
— как она интегрирована с ускорителями
— насколько эффективно работает в связке с сетью

И тут у тех же Samsung и SK Hynix позиции как раз сильные, потому что они уже глубоко в теме HBM и кастомных решений под AI.

Ну и ещё момент, который часто упускают: рынок памяти исторически цикличный. После такого роста (200–300%) коррекция была практически неизбежна, и повод бы всё равно нашли — TurboQuant просто оказался удобным триггером.

Если смотреть чуть дальше, я бы вообще поставил вопрос иначе:
не приведут ли такие оптимизации к тому, что «сырой объём» станет менее важен, а конкуренция сместится в сторону архитектуры — кто лучше встроится в стек AI (GPU + память + сеть + софт)?

Потому что ощущение, что мы постепенно уходим от «продали больше чипов» к «продали более эффективную систему».
 
shape1
shape2
shape3
shape4
shape7
shape8
Верх Низ