Acasă Gândire înainte Procesoare mobile din 2018: creșterea funcțiilor de învățare automată

Procesoare mobile din 2018: creșterea funcțiilor de învățare automată

Cuprins:

Video: Cel mai Bun Procesor -Top Procesoare (Octombrie 2024)

Video: Cel mai Bun Procesor -Top Procesoare (Octombrie 2024)
Anonim

Nu este surprinzător, smartphone-urile din acest an dispun de procesoare mai rapide decât cele de anul trecut, ceea ce se întâmplă în fiecare an. Însă ce este nou anul acesta este predominanța funcțiilor de învățare a mașinilor, pe care aproape fiecare vânzător de procesoare le prezintă ca o modalitate de diferențiere a dispozitivelor. Acest lucru este valabil pentru furnizorii de telefonie care își proiectează jetoanele proprii, furnizorii de cipuri independenți sau comercianți care vând procesoare către furnizorii de telefon și chiar producătorii de IP care proiectează nucleele care intră în procesoare.

fundal

Mai întâi un fundal mic: toate procesoarele moderne de aplicații includ modele (adesea denumite proprietate intelectuală sau IP) de la alte companii, în special firme precum ARM, Imagination Technologies, MIPS și Ceva. Un astfel de IP poate apărea sub diverse forme - de exemplu, ARM vinde totul, de la o licență de bază pentru arhitectura sa pe 32 de biți și pe 64 de biți, până la nuclee specifice pentru procesoare, grafică, procesare de imagini etc., pe care designerii de cipuri le pot folosi apoi creați procesoare. În mod obișnuit, designerii de cipuri amestecă și potrivesc aceste nuclee cu designuri proprii și fac diverse alegeri cu privire la memorie, interconectări și alte caracteristici, pentru a echilibra performanța cu cerințele de putere, dimensiunea și costul.

Pe fața procesorului, majoritatea cipurilor au o combinație de nuclee mai mari, care sunt mai puternice și rulează mai repede și mai fierbinte, și nuclee mai mici, care sunt mai eficiente. În mod obișnuit, telefoanele vor folosi nucleele mai mici de cele mai multe ori, dar pentru sarcini solicitante vor trece la nucleele cu performanțe superioare și vor folosi o combinație de nuclee și GPU și alte nuclee pentru a gestiona cel mai bine nevoile de performanță și considerațiile termice (nu puteți rulați nucleele de înaltă performanță foarte mult timp, deoarece s-ar supraîncălzi, și, de obicei, nu este necesar). Cele mai cunoscute exemple pentru nucleele mari sunt nucleele Cortex-A75 și A73 ale ARM; nucleele mai mici potrivite ar fi A55 și A53. În telefoanele high-end de astăzi, veți vedea adesea patru dintre ele, în ceea ce este cunoscut ca un layout octa-core, deși unii furnizori au adoptat alte abordări.

În ceea ce privește grafica, există mai multă diversitate, unii furnizori alegând linia Mali a ARM, alții alegând PowerVR-ul Imagination Technologies, iar alții optează pentru a-și proiecta propriile nuclee grafice. Și există și mai multă diversitate atunci când vine vorba de lucruri precum procesarea imaginilor, procesarea digitală a semnalului și funcționarea IA târziu.

măr

Apple a început să-și împingă capabilitățile AI în anunțurile sale de toamnă, inclusiv în special cipul „A11 Bionic” utilizat în iPhone 8 și 8 Plus, precum și iPhone X.

A11 Bionic este o arhitectură cu șase nuclee, cu două nuclee performante și patru nuclee de eficiență. Apple își proiectează propriile nuclee (sub licență de arhitectură ARM) și a împins în mod tradițional performanțele cu un singur fir. Acesta este un pas din A10 Fusion cu patru nuclee, iar Apple a spus că nucleele de performanță în A11 sunt cu până la 25 la sută mai rapide decât în ​​A10, în timp ce cele patru nuclee de eficiență pot fi cu până la 70% mai rapide decât cipul A10 Fusion. Acesta a mai spus că procesorul grafic este cu până la 30 la sută mai rapid.

Apple vorbește despre cipul care are un motor dual-core „Neural Engine”, care poate ajuta la recunoașterea scenelor în aplicația pentru camere, și Face ID și Animoji pe iPhone X. Compania a lansat, de asemenea, o API numită CoreML, pentru a ajuta terții dezvoltatorii creează aplicații care profită de acest lucru.

De obicei, Apple nu oferă multe informații despre procesoarele sale, dar spune că motorul neuronal A11 Bionic este un design dual-core care poate efectua până la 600 de miliarde de operații pe secundă pentru procesare în timp real.

Spre deosebire de majoritatea celorlalți producători de procesoare, Apple nu integrează modemul în procesoarele sale de aplicații și folosește în schimb modemuri de sine stătătoare Qualcomm sau Intel. A existat o anumită controversă cu privire la faptul că Apple acceptă doar funcțiile din modemurile sale Qualcomm care sunt, de asemenea, acceptate de Intel; în practică, acest lucru înseamnă că iPhone-urile acceptă agregarea de 3 căi, dar nu unele dintre funcțiile mai avansate.

Huawei

Huawei a fost, de asemenea, devreme pentru a împinge AI și a numit Kirin 970, pe care l-a anunțat la emisiunea IFA toamna trecută, „prima unitate mobilă de procesare a AI din lume”. Kirin 970 este folosit chiar acum în Huawei Mate 10. Acesta include patru nuclee de procesare Cortex-A73 care funcționează până la 2, 4 GHz și patru A53s care rulează până la 1, 8 GHz, împreună cu GPU Mali G72 MP12 de la ARM.

Ceea ce este deosebit de nou în 970 este ceea ce Huawei numește NPU sau unitatea de procesare neurală. Compania a spus că sarcinile care pot fi descărcate acestui procesor pot vedea de 25 de ori performanța și de 50 de ori eficiența față de cele care rulează pe clusterul CPU. Acest lucru este destinat, în special, la recunoașterea mai rapidă a imaginii și o fotografie mai bună. În cadrul emisiunii, Huawei a spus că telefonul poate procesa 1.92 TeraFLOP-uri pe 16 biți.

Kirin 970 are un procesor de semnal cu imagini duale, un modem de categoria 18 LTE cu agregare cu 5 purtători și 4-by-4 MIMO care ar trebui să permită o viteză maximă de descărcare de 1, 2 Gbps.

La Mobile World Congress, Huawei a anunțat primul său modem 5G, Balong 5G01, despre care a spus că va fi primul modem 5G livrat. Se pare că unele viitoare procesoare de aplicații vor adopta și acest modem, dar acest lucru nu a fost anunțat încă. Tehnic, toate aceste produse sunt create de filiala HiSilicon a firmei.

Qualcomm

Cipul care probabil se va afla în centrul majorității telefoanelor emblematice Android din SUA în acest an este Snapdragon 845 de la Qualcomm. Acesta este un upgrade al Snapdragon 835, care a fost utilizat în majoritatea telefoanelor Android premium din 2017 și este deja utilizat în versiunile nord-americane ale Galaxy S9.

Ca și în cazul majorității celorlalți furnizori, Qualcomm împinge rețelele neuronale și AI ca una dintre cele mai mari domenii de îmbunătățiri ale cipului din acest an, împreună cu un accent sporit pe „imersiune” - ceea ce înseamnă, în esență, imagini mai bune.

În zona AI, Qualcomm îi place să vorbească despre faptul că are un motor de procesare neuronală multi-core (NPE), care folosește o nouă versiune a DSP-ului Hexagon, precum și CPU și GPU pentru inferencing.

Cipul are Hexagon 685 DSP, despre care Qualcomm spune că poate mai mult decât dubla performanța procesării AI; un procesor Kryo 385, despre care spune că oferă o creștere a performanței cu 25 până la 30 la sută pentru nucleele sale de performanță (patru nuclee ARM Cortex-A75 cu până la 2, 85 GHz) și cu o creștere de 15% la performanță pentru „nucleele sale de eficiență (patru Nucleele Cortex-A55 rulând până la 1, 8 GHz), cu toate partajarea unui cache L3 de 2MB și un GPU Adreno 630, despre care Qualcomm spune că va susține o îmbunătățire a performanței de 30 la sută sau o reducere a puterii de 30%, precum și de până la 2, 5 ori afișări mai rapide.

În zona AI, cipul acceptă un număr mare de cadre diferite de învățare a mașinilor, iar compania spune că aceasta funcționează pentru lucrări precum clasificarea obiectelor, detectarea feței, segmentarea scenei, recunoașterea difuzoarelor, etc. Două aplicații evidențiate sunt efecte bokeh live (pentru realizarea de portrete cu fundal încețoșat) și senzor de adâncime activ și lumină structurată, care ar trebui să permită recunoașterea îmbunătățită a feței. Prin mutarea inferențelor din cloud pe dispozitiv, Qualcomm spune că obțineți beneficiile unei latențe scăzute, confidențialitate și fiabilitate îmbunătățită.

În zona de imagini, cipul are o nouă versiune a Spectra ISP de la Qualcomm, captarea video Ultra HD îmbunătățită, cu reducerea zgomotului cu mai multe cadre, capacitatea de a captura video de 16 megapixeli la 60 de cadre pe secundă și video de 720p slow-mo la 480 cadre pe secundă. Pentru VR, 845 suporte afișează cu o rezoluție 2K-by-2K la 120 cadre pe secundă, un pas mare de la 1.5K-by-1.5K la 60 cadre pe secundă suportate de 835.

Alte caracteristici includ o unitate de procesare sigură, care își folosește propriul nucleu pentru a stoca informații de securitate în afara nucleului și funcționează cu capabilitatea TrustZone a CPU și Qualcomm.

845 integrează modemul X20 pe care Qualcomm l-a introdus anul trecut, care este capabil să sprijine categoria 18 LTE (cu viteze de până la 1, 2 Gbps), până la 5 agregări de purtători și 4X4 MIMO și folosește tehnici precum Accesul asistat cu licență pentru a face mai rapid viteze posibile în mai multe zone.

Cipul este fabricat pe un proces de consum redus de 10 nm de la Samsung.

Qualcomm face, de asemenea, familia Snapdragon 600 de procesoare de aplicații, condusă de 660, care este folosită de mulți furnizori chinezi, inclusiv Oppo și Vivo. În lansarea Mobile World Congress, a introdus familia Snapdragon 700, care are multe dintre aceleași caracteristici ca și familia 800, inclusiv DSP Hexagon, ISP Spectra, grafică Adreno și CPU Kryo. Comparativ cu 660, Qualcomm spune că va oferi o îmbunătățire de 2x a aplicațiilor AI pe dispozitiv și o îmbunătățire de 30% a eficienței energetice.

Samsung

În timp ce folosește procesoare Qualcomm în majoritatea telefoanelor sale din America de Nord, în multe alte piețe, Samsung folosește procesoarele Exynos proprii și începe să pună la dispoziția altor producători de telefoane.

Noul său top-of-the-line este Exynos 9810, pe care Samsung îl va folosi în versiunile internaționale ale Galaxy S9 și S9 +.

Din nou, Samsung împinge noi caracteristici pentru „software bazat pe învățare profundă”, despre care spune că ajută procesorul să identifice cu exactitate articole sau persoane din telefoane și susține sensul profund pentru recunoașterea feței.

9810 este, de asemenea, un cip octa-core, cu patru nuclee A55 pentru eficiență energetică și patru modele de procesare personalizate pentru performanță. Samsung spune că aceste nuclee noi, care pot funcționa până la 2, 9 GHz, au o conductă mai largă și o memorie cache optimizată, oferindu-le de două ori performanța cu un singur nucleu și cu 40% mai multă performanță multi-core în comparație cu predecesorul său, 8895 de anul trecut. Referatele publicate arată îmbunătățiri în lumea reală, dar nu la fel de susținute, rămân sceptic față de toate punctele de referință pentru mobil în acest moment.)

Alte caracteristici includ grafica Mali-G72 MP18, suport pentru până la 3840-by-2400 afișaje și afișaje 4096-by-2160, un procesor de semnal imagine dual (ISP) și suport pentru captarea 4K la 120 de cadre pe secundă. 9810 are, de asemenea, un modem de categoria 18, cu 6 agregări de purtător și 4-by-4 MIMO pentru downlink (2 CA pentru legătura ascendentă), cu o viteză de downlink de maxim 1, 2 Gbps și 200 Mbs de încărcare. Pe hârtie, acest lucru se potrivește cu modemurile din categoria 18 pe care atât Qualcomm cât și Huawei le au în cipurile de top actuale. La fel ca Snapdragon 845, este fabricat pe cel de-al doilea proces de finifet de 10 nm Samsung.

MediaTek

MediaTek a jucat mai mult în telefoanele de gamă medie și mai jos, iar luna trecută a introdus un nou cip numit Helio P60, care vizează piața „New Premium” - telefon de pe piața medie, în gama de 200 - 400 USD care oferă toate caracteristici de bază ale telefoanelor superioare. Primul telefon a anunțat că va folosi acest cip este Oppo R15.

Procesorul de top al companiei, anunțat anul trecut, este Helio X30, care este un procesor deca-core destinat telefoanelor premium. Aceasta include două nuclee de procesor ARM Cortex-A73, care rulează până la 2, 5 GHz, patru nuclee Cortex-A53 care rulează până la 2, 2 GHz și patru nuclee A35 care pot rula până la 1, 9 GHz, împreună cu graficele PowerVR din seria 7XT Plus ale imaginației la 800 GHz și un modem din categoria 10 LTE capabil de agregare cu 3 purtători pe legătura descendentă. Este un cip interesant, produs pe procesul de 10 milimetri al TSMC și împinge ideea că mai multe nuclee pot fi mai flexibile. Printre telefoanele anunțate care le folosesc se numără Meizu Pro 7 Plus cu ecrane duale, și Vernee Apollo 2 (cameră frontală de 8MP, camere spate de 16MP + 13MP).

Anul trecut, MediaTek a anunțat două procesoare de pe piața medie, Helio P23 și P30, care vizează piețele globale și în special China, fiecare având opt nuclee Cortex-A53 cu 2, 53 GHz și grafică Mali G71 MP2. Acestea sunt cipurile pe care P60 este proiectat să le înlocuiască și oferă mai multă putere și permit o serie de funcții noi.

P60 oferă mai multe performanțe și este o revenire la configurația mare.LITTLE ARM și MediaTek împinsă în anii precedenți, combinând patru dintre cele mai puternice ARM Cortex-A73 la până la 2, 0 GHz cu patru dintre cele mai eficiente Cortex-A53 nuclee, de asemenea, la 2, 0 GHz. Acestea li se alătură un GPU ARM Mali G72 NMP3 la 800 MHz și sunt controlate de a patra versiune a tehnologiei CorePilot MediaTek pentru programarea unde se execută sarcinile. În comparație cu P23 și P30, MediaTek spune că P60 oferă o îmbunătățire a performanței de 70 la sută atât în ​​operațiile CPU cât și în GPU.

MediaTek este și el pe banda de AI, P60 incluzând platforma NeuroPilot pentru accelerarea hardware-ului rețelei neuronale. Aceasta acceptă rețeaua neuronală Google Android (NN) și cadrele comune AI, incluzând TensorFlow, TensorFlow Lite, Caffe și Caffe 2. Acesta este în mod eficient un procesor digital specializat de semnal, capabil de 280 GMAC (miliarde de operații cu acumulare multiplă pe secundă). Este conceput pentru a fi folosit pentru lucruri precum recunoașterea facială pentru deblocarea unui telefon (ceva ce am văzut în telefoanele high-end, dar nu și telefoanele mid-range până acum) și recunoașterea obiectelor, chiar și în videoclipuri, la 60 de cadre pe secundă.

În plus, P60 are o serie de funcții de imagine noi, inclusiv trei procesoare de senzori de imagine care pot suporta o configurație cu două camere foto de 16 și 20 MP sau o singură cameră de până la 32 MP. (Încă nu am văzut un telefon în producție cu un senzor de cameră cu mulți megapixeli, dar se presupune că vin.) Acești senzori adaugă funcții de reducere a zgomotului, împreună cu bokeh-ul în timp real (estomparea fundalului folosit în modurile de portret).

Cipul include un modem care acceptă descărcări de categoria 7 (până la 300 Mbps) și încărcări de categoria 13 (până la 150 Mbps cu 2 agregări de purtători). Acesta este fabricat pe procesul de 12 nm FinFet al TSMC, despre care compania spune că îl ajută să asigure economii de energie de 25 la sută pentru aplicații cu consum mare de energie, precum jocuri și, în general, economii de energie de 12%.

Spreadtrum

Spreadtrum, care face ca modemurile să fie vândute în cea mai mare parte pe piața chineză, a anunțat un parteneriat cu Intel care va folosi modemul 5G și procesoarele ARM compatibile cu Intel. Acesta mai este încă câțiva ani, așa că detaliile nu sunt încă disponibile.

Rețineți că, deși Spreadtrum nu este foarte vizibil în SUA, acesta urmărește doar Qualcomm și MediaTek pe piața comerciantă pentru procesoarele de aplicații. Vinde mai ales produse cu procesoare ARM și modem propriu 4G, dar are o înțelegere și este deținută de minorități, Intel. Aceasta a dus la un cip cu procesoare Intel și modem Spreadtrum (opusul noului anunț).

BRAŢ

Desigur, nu numai producătorii de cipuri văd AI ca următorul mare val, iar companiile care fac IP-ul au făcut, de asemenea, o apăsare mare în acest domeniu.

ARM, cel mai de succes dintre producătorii de IP, a anunțat o suită de IP pentru învățarea mașinilor luna trecută, inclusiv hardware și software, și a împins acest lucru la Mobile World Congress.

Proiect dublu trillium, acesta include design-uri de procesor (IP) atât pentru învățare automată (ML) cât și pentru detectarea obiectelor (OD), împreună cu o nouă bibliotecă software.

Procesorul ML este proiectat pentru a sta într-un procesor de aplicații și a rula alături de procesor, GPU și core display. Biblioteca software, cunoscută sub numele de ARM NN (rețea neuronală), este proiectată pentru a sprijini cadre precum TensorFlow, Caffe și Android NN. Acest lucru le permite acestor aplicații să ruleze prin software numai pe procesoare existente care au procesoare ARM și grafică; deși, desigur, va fi accelerat considerabil atunci când este rulat pe procesoare care includ nucleele ML. Software-ul terț va funcționa și pe nucleul procesorului. ARM spune că nucleul ML a fost proiectat de la sol în special pentru a rula rețele neuronale. Poate rula atât aplicații pe 8, cât și pe 16 biți, deși tendința este să se concentreze pe 8 biți pentru simplitate.

Procesorul OD este proiectat pentru a sta alături de un procesor de semnalizare a imaginii (ISP), pentru a asigura detectarea obiectelor cu putere redusă, în special pentru aplicații precum detectarea feței și urmărirea mișcării. Acesta este un bloc hardware dedicat, conceput pentru a fi utilizat cu noi tehnologii cu senzori, cum ar fi camerele stereoscopice.

ARM a declarat că noul IP va fi disponibil pentru previzualizarea dezvoltatorilor în aprilie și va fi în general disponibil mai târziu în acest an, dar, având în vedere un ciclu de timp tipic, este puțin probabil ca noile nuclee ale procesorului să apară în cipuri până în 2019 sau mai târziu. Desigur, software-ul, care funcționează pe nucleele existente, ar putea fi implementat mult mai devreme.

ARM a împins, de asemenea, câteva soluții noi pentru Internet of Things, inclusiv o nouă soluție SIM numită Kigen, concepută pentru a fi construită în SoCs pentru dispozitive cu consum redus pentru a înlocui cardurile SIM fizice de astăzi.

Tehnologii de imaginație

Imaginația, cunoscută pentru graficele sale PowerVR, și-a anunțat IP-ul de rețea neurală în toamna trecută, PowerVR 2NX Neural Network Acceleration (NNA). Aceasta este o arhitectură flexibilă cu unul până la opt nuclee, fiecare putând avea 256 unități de acumulare multipla (8 MAC) pe 8 biți. Imaginația a spus că poate efectua peste 3, 2 trilioane de operații pe secundă.

CEVA

Alți furnizori de IP ajung și pe piață. Ceva, care este cunoscut pentru nucleele sale DSP, tocmai a anunțat NeuPro, o familie de nuclee de procesoare AI concepute pentru dispozitivele de bord. Acestea se bazează pe procesoare pe care firma le-a vândut în zona vizionării computerului și folosesc cadrul CDNN pentru o varietate de „procese AI”. Acest lucru va funcționa cu cadrele comune de învățare a mașinilor și le va converti pentru a rula pe procesoare mobile pentru inferențiere. Compania planifică procesoare cuprinse între 2 și 12, 5 teraops pe secundă (TOPS), concepute pentru consumatori, supraveghere și produse ADAS (pentru vehicule autonome). Ceva a spus că un client major al automobilelor intenționează să permită 100 de TOP-uri de performanță folosind mai puțin de 10 wați de putere. Licențierea va începe în a doua jumătate a acestui an.

De asemenea, Ceva și-a anunțat platforma PentaG de DSP-uri pentru modemuri în bandă de bază 5G. Compania spune că DSP-urile sale actuale sunt în 40 la sută din telefoanele din lume, acoperind aproximativ 900 de milioane de telefoane pe an și în modemuri de la Intel, Samsung și Spreadtrum. Noua platformă are mai mult AI, folosită în special pentru „adaptarea legăturilor”. În lumea 5G, telefoanele pot avea mai multe legături către o stație de bază, iar Ceva spune că hardware-ul și software-ul său ajută la determinarea celei mai bune legături la fiecare câteva milisecunde. Acest lucru poate economisi multă energie în comparație cu utilizarea software-ului singur. Acesta nu este un DSP de uz general sau un cip de rețea neuronală, ci unul conceput special pentru comunicații. Acesta a fost doar anunțat și ar trebui să fie disponibil în trimestrul al treilea.

Ceva face, de asemenea, o presiune mare pentru DSP-urile pe piața stațiilor de bază 5G și a spus că până la 50% din noua infrastructură radio 5G va folosi IP-ul DSP al companiei, inclusiv sisteme de la Nokia și ZTE.

Ce probabilitate ai să recomande PCMag.com?

Procesoare mobile din 2018: creșterea funcțiilor de învățare automată