Потужні та компактні: що таке чіплети і чому вони визначають майбутнє процесорів

Чіплет AMD
Фото: AMD | AMD уже створює чіплети, адже за ними — майбутнє обчислювальної техніки

Технологія чіплетів допомагає обійти фізичні обмеження напівпровідникових чіпів і скоро може стати новим стандартом для виробників.

Related video

Хоча чіплети існують уже кілька десятиліть, їхнє використання історично обмежувалося спеціалізованими додатками. Але сьогодні вони перебувають на передньому краї технологій, забезпечуючи роботу мільйонів настільних ПК, робочих станцій, серверів, ігрових консолей, телефонів і навіть носяться пристроїв по всьому світу. Фокус переклав статтю журналіста Ніка Евансона для Techspot про те, що таке чиплети, чому такі важливі і як вони змінять роботу електронних пристроїв у найближчому майбутньому.

Що таке чіплети?

Чіплети — це сегментовані процесори. Замість того, щоб об'єднувати кожну частину в один чіп (фахівці називають це монолітним підходом), певні секції виготовляються як окремі чіпи. Ці окремі чіпи потім монтуються разом в один пакет з використанням складної системи з'єднань.

Таке компонування дає змогу зменшити розміри деталей, під час виготовлення яких можна використовувати новітні методи, що підвищує ефективність процесу і дає змогу розмістити більше компонентів.

Чіплет Fullscreen
Приклад чиплета
Фото: techspot.com

Частини мікросхеми, які не можуть бути суттєво зменшені або не потребують зменшення, можуть бути виготовлені з використанням старих і більш економічних методів.

Хоча процес виробництва таких процесорів складний, загальна вартість зазвичай нижча. Крім того, це пропонує компаніям-виробникам процесорів більш керований шлях для розширення асортименту своєї продукції.

Лише за кілька років більшість провідних виробників мікросхем прийняли технологію чіплетів для впровадження інновацій. Тепер очевидно, що чиплети готові стати галузевим стандартом.

Наука про кремній

Щоб повністю зрозуміти, чому виробники процесорів звернулися до чіплетів, ми повинні спочатку розібратися, як виготовляються ці пристрої. Процесори і графічні процесори починають своє життя як великі диски з надчистого кремнію, зазвичай діаметром трохи менше ніж 12 дюймів (300 мм) і товщиною 0,04 дюйма (1 мм).

Ця кремнієва пластина проходить низку складних етапів, у результаті чого виходить кілька шарів різних матеріалів — ізоляторів, діелектриків і металів. Шаблони цих шарів створюють за допомогою процесу, званого фотолітографією, де ультрафіолетове світло просвічується через збільшену версію шаблону (маску), а потім стискається за допомогою лінз до необхідного розміру.

Малюнок повторюється із заданими інтервалами по всій поверхні пластини, і кожен з них зрештою стане процесором. Оскільки чіпи прямокутні, а пластини круглі, візерунки повинні перекривати периметр диска. Ці частини, що перекриваються, в кінцевому підсумку видаляють, оскільки вони нефункціональні.

Кремнієва пластина напівпровідники Fullscreen
Кремнієва пластина з візерунками для чипів
Фото: techspot.com

Після завершення пластина тестується за допомогою зонда, прикладеного до кожного чіпа. Результати електричної перевірки інформують інженерів про якість процесора за довгим списком критеріїв. Цей початковий етап, відомий як сортування чипів, допомагає визначити "клас" процесора.

Наприклад, якщо чип має стати центральним процесором, кожна частина має функціонувати правильно, працюючи в заданому діапазоні тактових частот за певної напруги. Потім кожна секція пластини класифікується на основі результатів цих тестів.

Після завершення пластина розрізається на окремі частини, або "кристали", які придатні для використання. Потім ці кристали монтуються на підкладку, схожу на спеціалізовану материнську плату. Процесор проходить подальшу упаковку (наприклад, за допомогою тепловідведення) перед тим, як він буде готовий до продажу.

Чіплет Fullscreen
Процес виготовлення чиплетів складний
Фото: techspot.com

Уся послідовність виробництва може зайняти кілька тижнів, а такі компанії, як TSMC і Samsung, стягують високу плату за кожну пластину — від 3000 до 20 000 доларів США залежно від використовуваного технологічного вузла.

"Технологічний вузол" — це термін, який використовується для опису всієї системи виготовлення. Історично вони називалися за довжиною затвора транзистора. Однак у міру вдосконалення виробничих технологій і появи все більш дрібних компонентів номенклатура більше не слідувала жодному фізичному аспекту кристала, і тепер це просто маркетинговий інструмент.

Проте кожен новий вузол процесу приносить переваги порівняно зі своїм попередником. Він може бути дешевшим у виробництві, споживати менше енергії за тієї самої тактової частоти (чи навпаки) або мати вищу щільність. Останній параметр вказує, скільки компонентів може поміститися в заданій області кристала. На графіку нижче ви можете побачити, як це розвивалося з роками для графічних процесорів (найбільших і найскладніших чипів, які ви знайдете в ПК.

Графік щільності графічних процесорів Fullscreen
Графік збільшення щільності графічних процесорів
Фото: techspot.com

Поліпшення у вузлах процесу надають інженерам можливість збільшити можливості та продуктивність своїх продуктів без необхідності використання більших і дорожчих чіпів. Однак наведений вище графік показує тільки частину історії, оскільки не кожен аспект процесора може виграти від цих удосконалень.

Схеми всередині мікросхем можна віднести до однієї з таких широких категорій:

  • Логічні — обробляє дані, математику та ухвалює рішення.
  • Пам'ять — зазвичай SRAM, у якій зберігаються дані для логіки.
  • Аналогові — схеми, що керують сигналами між чипом та іншими пристроями.

На жаль, тоді як логічні схеми продовжують зменшуватися з кожним великим кроком вперед у технології вузлів процесу, аналогові схеми практично не змінилися, а SRAM також починає наближатися до межі.

Графік типи схем Fullscreen
Розвиток різних типів схем залежно від технологічного вузла
Фото: techspot.com

Хоча логічні схеми, як і раніше, становлять більшу частину кристала, об'єм SRAM у сучасних ЦП і ГП значно зріс за останні роки. Наприклад, чип Vega 20 від AMD, використовуваний у відеокарті Radeon VII (2019), мав загалом 5 МБ кешу L1 і L2. Лише два покоління графічних процесорів потому чип Navi 21, який використовують у серії Radeon RX 6000 (2020), містив понад 130 МБ об'єднаного кешу — вражаюче збільшення у 25 разів.

Очікується, що цей показник продовжуватиме зростати в міру розроблення нових поколінь процесорів, але оскільки об'єм пам'яті не зменшується так само, як об'єм логічних схем, виробництво всіх схем на одному технологічному вузлі ставатиме дедалі менш рентабельним.

В ідеальному світі можна було б спроектувати кристал, у якому аналогові секції виготовляються на найбільшому і найдешевшому вузлі, деталі SRAM — на набагато меншому, а логіка зарезервована для абсолютно передової технології. На жаль, це практично недосяжно. Однак існує альтернативний підхід.

Розділяй і володарюй

У 1995 році Intel представила Pentium II, наступника свого оригінального процесора P5. Що відрізняло його від інших процесорів того часу, то це дизайн, прихований під пластиковим щитком: друкована плата, що вміщає два чіпи. Основний чип містив усю логіку оброблення й аналогові системи, тоді як один або два окремі модулі SRAM слугували кешем 2-го рівня.

Тоді як Intel виробляла основний чіп, кеш-пам'ять закуповували у зовнішніх постачальників. Цей підхід став досить стандартним для настільних ПК у середині-кінці 1990-х років, поки досягнення у виробництві напівпровідників не дали змоги повністю інтегрувати логіку, пам'ять і аналогові системи в один кристал.

Процесор Intel's Pentium II Fullscreen
Процесор Intel's Pentium II: ЦП (по центру) і модулі пам'яті (праворуч)
Фото: Wikimedia Commons

У той час як Intel продовжувала балуватися з кількома чіпами в одному корпусі, вона в основному дотримувалася так званого монолітного підходу до процесорів — тобто один чіп для всього. Для більшості процесорів не було необхідності в більш ніж одному кристалі, оскільки технології виробництва були досить досконалими (і доступними), щоб зробити це простим.

Однак інші компанії були більш зацікавлені у використанні багаточіпового підходу, насамперед IBM. У 2004 році можна було придбати 8-чіпову версію серверного ЦП POWER4, яка містила чотири процесори та чотири кеш-модулі, усі змонтовані в одному корпусі (відомий як багаточіповий модуль або підхід MCM).

Приблизно в цей же час почав з'являтися термін "гетерогенна інтеграція" частково через дослідницьку роботу DARPA. Гетерогенна інтеграція спрямована на поділ різних секцій системи обробки, виготовлення їх окремо на вузлах, які найбільше підходять для кожної, а потім об'єднання їх в один пакет.

Сьогодні це більш відомо як система-в-корпусі (SiP) і є стандартним методом оснащення смарт-годинників чіпами з моменту їхньої появи. Наприклад, Apple Watch Series 1 містять ЦП, трохи DRAM і NAND Flash, кілька контролерів та інші компоненти в одній структурі.

S1 SiP від Apple рентген Fullscreen
Рентгенівський знімок системи в корпусі S1 від Apple
Фото: iFixit

Аналогічна установка може бути досягнута шляхом розміщення різних систем на одному кристалі (відомому як SoC або система на кристалі ). Однак цей підхід не дає змоги скористатися перевагами різних цін на вузли, і не всі компоненти можуть бути виготовлені таким чином.

Для постачальника технологій використання гетерогенної інтеграції для нішевого продукту — це одне, а застосування її для більшої частини свого портфоліо — зовсім інше. Саме це і зробила AMD зі своєю лінійкою процесорів. У 2017 році напівпровідниковий гігант представив свою архітектуру Zen, випустивши однокристальний настільний процесор Ryzen. Лише через кілька місяців AMD дебютувала з двома багатокристальними лінійками продуктів: Threadripper і EPYC, причому остання мала конфігурації до чотирьох кристалів.

Із запуском Zen 2 два роки потому AMD повністю прийняла HI, MCM, SiP — називайте як хочете. Вони винесли більшу частину аналогових систем із процесора і помістили їх в окремий кристал. Їх було виготовлено на простішому і дешевшому технологічному вузлі, тоді як просунутіший використовували для решти логіки і кешу.

І ось "чіплети" стали модним словом.

Менше — краще

Щоб зрозуміти, чому AMD вибрала саме цей напрямок, давайте розглянемо зображення нижче. На ньому показано два старі процесори серії Ryzen 5 — 2600 зліва, що використовує так звану архітектуру Zen+, і 3600 на базі Zen 2 праворуч.

Теплорозподільники на обох моделях були видалені, а фотографії зроблені за допомогою інфрачервоної камери. Один кристал 2600 вміщує вісім ядер, хоча два з них відключені для цієї конкретної моделі.

Процесори Ryzen 5 Fullscreen
Процесори Ryzen 5 2600 (ліворуч) і Ryzen 5 3600 (праворуч)
Фото: Flickr/Fritzchen Fritz

Те ж саме стосується і 3600, але тут ми бачимо, що в корпусі є два кристали — кристал Core Complex Die (CCD) вгорі, який містить ядра і кеш, і кристал Input/Output Die (IOD) внизу, який містить всі контролери (для пам'яті, PCI Express, USB тощо) і фізичні інтерфейси.

Оскільки обидва процесори Ryzen підходять до одного і того ж роз'єму материнської плати, два зображення по суті масштабовані. На перший погляд може здатися, що два кристали в 3600 мають більшу загальну площу, ніж один кристал у 2600, але зовнішність буває оманливою.

Якщо безпосередньо порівняти чіпи, що містять ядра, то стає зрозуміло, скільки місця в старій моделі займає аналогова схема — це все синьо-зелені кольори, що оточують золотисті ядра і кеш. Однак у Zen 2 CCD дуже мало площі кристала відведено під аналогові системи; вона майже повністю складається з логіки і SRAM.

Чип Zen+ має площу 213 мм² і був виготовлений GlobalFoundries з використанням свого 12-нм технологічного вузла. Для Zen 2 AMD зберегла послуги GlobalFoundries для 125 мм² IOD, але використовувала чудовий вузол N7 від TSMC для 73 мм² CCD.

Чипи Zen+ і Zen 2 Fullscreen
Чип Zen+ (угорі) проти Zen 2 CCD (унизу)
Фото: Tech Spot

Загальна площа чипів у новій моделі менша, і вона також може похвалитися вдвічі більшим кешем L3, підтримуючи швидшу пам'ять і PCI Express. Однак найкраща частина підходу з чіплетами полягала в тому, що компактний розмір CCD дозволив AMD розмістити ще один в упаковці. Ця розробка дала життя серії Ryzen 9, що пропонує 12-ти і 16-ядерні моделі для настільних ПК.

Ще краще, використовуючи два менших чіпи замість одного великого, кожна пластина може потенційно виробляти більше кристалів. У випадку Zen 2 CCD одна 12-дюймова (300 мм) пластина може виробляти до 85% більше кристалів, ніж для моделі Zen+.

Що менший шматок пластини, то менша ймовірність виявлення виробничих дефектів (оскільки вони, як правило, випадково розподілені на диску), тому, беручи все це до уваги, підхід на основі чіплетів не лише дав AMD можливість розширити своє портфоліо, а й зробив це набагато економічно ефективнішим — одні й ті самі ПЗЗ-матриці можна використовувати в кількох моделях, і кожна пластина виробляє сотні таких матриць!

Але якщо цей вибір дизайну настільки вигідний, чому Intel його не використовує? Чому ми не бачимо його використання в інших процесорах, наприклад, у графічних процесорах?

Слідуючи за лідером

Щоб відповісти на перше запитання, Intel також поступово впроваджує технологію чиплетів. Перша споживча архітектура ЦП, яку вони поставили з використанням чіплетів, називається Meteor Lake. Однак підхід Intel певною мірою унікальний, тому давайте розглянемо, чим він відрізняється від підходу AMD.

Процесор Meteor Lake у вигляді чіплета Fullscreen
Процесор Meteor Lake використовує архітектуру чіплетів
Фото: Intel

Використовуючи термін "модулі" замість "чіплети", це покоління процесорів розділило раніше монолітну конструкцію на чотири окремі чіпи:

  • Обчислювальний модуль: містить усі ядра та кеш L2
  • Модуль GFX: містить інтегрований графічний процесор.
  • SoC-модуль: містить кеш L3, PCI Express та інші контролери
  • Модуль введення-виведення: забезпечує фізичні інтерфейси для пам'яті та інших пристроїв.

Високошвидкісні з'єднання з низькою затримкою присутні між SoC і трьома іншими модулями, і всі вони під'єднані до іншого кристала, відомого як інтерпозер. Він подає живлення на кожен чіп і містить доріжки між ними. Потім інтерпозер і чотири модулі монтуються на додаткову плату, щоб можна було упакувати всю збірку.

На відміну від Intel, AMD не використовує якийсь спеціальний монтажний кристал, але має власну унікальну систему з'єднання, відому як Infinity Fabric, для опрацювання транзакцій даних чіплетів. Подача живлення здійснюється через досить стандартний пакет, і AMD також використовує менше чіплетів. Так чому ж дизайн Intel такий?

Одна з проблем підходу AMD полягає в тому, що він не дуже підходить для ультрамобільного сектора з низьким енергоспоживанням. Ось чому AMD досі використовує монолітні процесори для цього сегмента. Дизайн Intel дає їм змогу змішувати та підбирати різні плитки для задоволення конкретних потреб. Наприклад, бюджетні моделі для доступних ноутбуків можуть використовувати набагато менші плитки скрізь, у той час як у AMD є тільки один розмір чіплета для кожної мети.

Недоліком системи Intel є те, що вона складна і дорога у виробництві (що призвело до різних проблем ). Однак обидві компанії, що виробляють процесори, повністю прихильні до концепції чіплетів. Щойно кожна частина виробничого ланцюжка буде спроектована навколо неї, витрати мають знизитися.

Що стосується графічних процесорів, вони містять відносно мало аналогових схем порівняно з іншою частиною кристала. Однак обсяг SRAM всередині неухильно зростає. Ця тенденція спонукала AMD використати свій досвід у сфері чіплетів у серії Radeon 7000, а графічні процесори Radeon RX 7900 мають конструкцію з кількома кристалами. Ці графічні процесори включають один великий кристал для ядер і кешу L2, а також п'ять або шість менших кристалів, кожен з яких містить частину кешу L3 і контролер пам'яті.

Перемістивши ці компоненти з основного кристала, інженери змогли значно збільшити обсяг логіки, не покладаючись на найновіші, найдорожчі вузли процесу, щоб зберегти розміри чіпів керованими. Хоча це нововведення, ймовірно, допомогло знизити загальні витрати, воно не значно розширило широту графічного портфоліо AMD.

Наразі споживчі графічні процесори Nvidia та Intel не демонструють жодних ознак прийняття чіплетного підходу AMD. Обидві компанії покладаються на TSMC для всіх виробничих завдань і, схоже, задоволені тим, що виробляють надзвичайно великі чіпи, перекладаючи витрати на споживачів.

Проте відомо, що обидві компанії активно вивчають і впроваджують архітектури на основі чіплетів у деякі зі своїх проєктів GPU. Наприклад, GPU Blackwell від Nvidia для центрів обробки даних використовують дизайн чіплетів із двома великими кристалами з високошвидкісним з'єднанням, здатним передавати дані зі швидкістю 10 терабайт на секунду, ефективно функціонуючи як один GPU.

Виконання "закону Мура" за допомогою чиплетів

Незалежно від того, коли відбуваються ці зміни, фундаментальна істина полягає в тому, що вони мають відбутися. Незважаючи на колосальні технологічні досягнення у виробництві напівпровідників, існує певна межа того, наскільки кожен компонент може бути зменшений.

Щоб продовжити підвищення продуктивності чіпа, в інженерів по суті є два шляхи — додати більше логіки з необхідною пам'яттю для її підтримки і збільшити внутрішню тактову частоту. Що стосується останнього, то середній ЦП не зазнав істотних змін у цьому аспекті за останні роки. Процесор AMD FX-9590, випущений у 2013 році, міг досягати 5 ГГц за певних робочих навантажень, тоді як максимальна тактова частота в його поточних моделях становить 5,7 ГГц (з Ryzen 9 9950X).

AMD Ryzen 9 9950X Fullscreen
Центральний процесор Ryzen 9 9950X від AMD
Фото: AMD

Найвисокочастотніший споживчий процесор Intel — Core i9-14900KS, максимальна частота турбо становить 6,2 ГГц на двох ядрах. Цей процесор "спеціального випуску" утримує рекорд за найвищою тактовою частотою "з коробки" серед настільних процесорів.

Однак змінилася кількість схем і SRAM. Згаданий вище AMD FX-9590 мав 8 ядер (і 8 потоків) і 8 МБ кешу L3, тоді як 9950X може похвалитися 16 ядрами, 32 потоками і 64 МБ кешу L3. Процесори Intel аналогічним чином розширилися з точки зору ядер і SRAM.

Перший уніфікований шейдерний GPU Nvidia, G80 2006 року, складався з 681 мільйона транзисторів, 128 ядер і 96 КБ кешу L2 у чипі площею 484 мм2. Перенесемося у 2022 рік, коли було випущено AD102, і тепер він містить 76,3 мільярда транзисторів, 18 432 ядра і 98 304 КБ кешу L2 у межах 608 мм2 площі кристала.

1965 року співзасновник Fairchild Semiconductor Гордон Мур помітив, що в перші роки виробництва чипів щільність компонентів усередині кристала подвоювалася щороку за фіксованої мінімальної вартості виробництва. Це спостереження стало відомим як закон Мура і пізніше було інтерпретовано як "кількість транзисторів у чіпі подвоюється кожні два роки", на основі виробничих тенденцій.

Процесори AMD Fullscreen
Схема розвитку 3D-упаковки чипів від AMD
Фото: AMD

Закон Мура слугував досить точним представленням прогресу напівпровідникової промисловості протягом майже шести десятиліть. Величезний приріст логіки та пам'яті як у центральних, так і в графічних процесорах значною мірою був зумовлений постійними поліпшеннями у вузлах процесу, при цьому компоненти ставали дедалі меншими з плином часу. Однак ця тенденція не може тривати вічно, незалежно від того, які нові технології з'являться.

Замість того, щоб чекати, поки будуть досягнуті ці фізичні межі, такі компанії, як AMD і Intel, взяли на озброєння технологію чіплетів, досліджуючи інноваційні способи об'єднання цих модульних компонентів для підтримки створення дедалі потужніших процесорів.

Через кілька десятків років середньостатистичний ПК, можливо, буде домівкою для ЦП і ГП розміром з вашу долоню. Але зніміть тепловідвід, і ви побачите безліч крихітних чипів — не три чи чотири, а десятки, всі майстерно зібрані й упаковані разом. Панування чиплетів тільки почалося.