Основ неуронских мрежа: Дешифровање
Преузето са: www.iso.org
Међународна организација за стандардизацију (ISO) је објавила вијест под називом „The basis of neural networks. Cracking the code“. Објављујемо превод ISO вијести.
Поткатегорија вјештачке интелигенције, неуронске мреже су модели вјештачке интелигенције који имају велики иновативни потенцијал. Од омогућавања рада интернет претраживача до препознавања гласа на нашим паметним телефонима, па до предвиђања болести на основу медицинског снимања, неуронске мреже су се већ показале као невјероватно свестране и моћне алатке, али далеко од тога да су показале сав свој потенцијал.
С обзиром на то да модели неуронских мрежа представљају основ свих разговора који се воде о вјештачкој интелигенцији, ова тема заслужује да се подробније задржимо на њој да бисмо разумјели све детаље. Дакле, шта су заправо неуронске мреже и како функционишу? Поједностављено речено, то су алгоритми способни да уоче, разграниче и открију обрасце који су присутни у подацима и који прате процес који имитира функционисање људског мозга. Да ли је ово чињеница или само фикција? Ова иновативна технологија дефинитивно помјера границе онога што смо мислили да је могуће.
У овом чланку покушаћемо да подигнемо вео с основних принципа неуронских мрежа и фокусираћемо се на то како оне на револуционаран начин мијењају наш однос с технологијом.
Садржај
· Шта је неуронска мрежа?
· За шта се користе неуронске мреже?
· Како функционишу неуронске мреже?
· Разумијевање различитих типова неуронских мрежа
· Како се обучавају неуронске мреже?
· Предности и недостаци неуронских мрежа
· Ка снажним AI мрежама
· Да ли су неуронске мреже будућност вјештачке интелигенције?
Шта је неуронска мрежа?
Неуронске мреже, које се називају и вјештачке неуронске мреже или симулиране неуронске мреже, јесу врста алгоритма за машинско учење инспирисана структуром и функцијом људског мозга. Састоје се од међусобно повезаних чворова, који се називају неурони. Али шта је неурон? Једноставно речено, неурони који чине AI неуронску мрежу су математичке функције које обрађују примљене информације (на рубу мреже, као што су синапсе) и као резултат производе нумеричку вриједност (у зависности од тога да ли је неурон активиран или не).
У AI неурони су дијелови софтвера који раде заједно на процесуирању и анализи сложених података. Сваки неурон прима информације из претходног слоја, примјењује математичку функцију на ове информације и затим преноси резултат сљедећем слоју. Избор и подешавање ових математичких функција представља главну потешкоћу у пројектовању неуронске мреже, с обзиром на то да њен цјелокупни учинак зависи од адекватности подешавања, односно поставки за добијање очекиваног резултата. Ово подешавање је омогућено аутоматским процесом који се зове обука.
За шта се користе неуронске мреже?
Иако су некада биле само концепт, неуронске мреже су данас технологија која на револуционаран начин мијења читав низ индустрија. Свестраност и моћ која их карактерише омогућавају вишеструке конкретне примјене које већ трансформишу начин на који користимо технологију и начин на који с њом комуницирамо. На примјер, могу да анализирају велике количине финансијских података и да предвиде трендове на берзи, солвентност или чак откривање преваре. Ова способност има потенцијал да значајно унаприједи инвестиционе стратегије и управљање ризиком.
У здравству се неуронске мреже користе за дијагнозу болести, развој лијекова и персонализовану медицину. Здравствени радници могу да користе вјештачке неуронске мреже за анализу медицинских снимака, картона пацијената и геномских података да би идентификовали обрасце и дали даљња предвиђања. Тако медицинске дијагнозе постају прецизније, а протоколи лијечења персонализованији. Неуронске мреже такође могу да помогну да се убрза развој лијекова омогућавањем анализе веома великих скупова података.
Аутономна возила представљају још једну област примјене неуронских мрежа, посебно за детекцију објеката, навигацију и доношење одлука у реалном времену, али и у подручју корисничког искуства.
У сектору услуга, четботови с вјештачком интелигенцијом имају велике користи од неуронских мрежа које омогућавају препознавање ентитета, обраду природног језика и анализу осјећања. Системи препорука, попут оних које предлажу емисије које би нам се могле свидјети које морамо погледати, ослањају се на препознавање образаца и могућности предвиђања.
Како функционишу неуронске мреже?
Фасцинантна ствар у вези с неуронским мрежама је да су инспирисане функционисањем људског мозга. Њихова структура се заснива на неколико кључних елемената.
· Прво, неурони, који су основне јединице симулираних неуронских мрежа. Они примају улазне сигнале, обрађују их користећи функције активације прије него што произведу излазне сигнале. Ови вјештачки неурони су међусобно повезани у слојевима да формирају мрежу. Први слој, назван улазни слој, прима почетне податке, док посљедњи слој, назван излазни слој, даје коначни резултат. Обрадом улаза из претходног слоја и њиховим преносом на сљедећи слој, сваки неурон омогућава проток информација кроз мрежу. Мрежа такође може да укључује један или више скривених слојева који се користе у процесу прорачуна.
· Тежине чине везу између неурона. Онe одређују јачину сигнала који се преноси с једног неурона на други. Тежине се коригују током фазе обуке неуронске мреже, тако да модел може да научи и побољша своје перформансе.
· Активационе функције, које омогућавају нелинеарност у неуронској мрежи, помажу мрежи да моделује сложеније односе у подацима. На основу улазних података онe одређују да ли се неурон треба активирати или не. Ове функције играју кључну улогу у одређивању понашања и способности учења неуронских мрежа.
Интеракције између ових кључних елемената су у самој суштини онога што дефинише вјештачку неуронску мрежу.
Ширење напријед, или пропагација унапријед, у суштини је основ на којем неуронске мреже функционишу, омогућавајући им да предвиђају и генеришу излазне податке. У суштини, ширење напријед је једноставан, али веома моћан процес. Састоји се од проласка улазних података кроз слојеве међусобно повезаних неурона, гдје сваки неурон кроз активациону функцију примјењује пондерисани збир улазних података.
Ширење уназад је често једнако важно. Ово је процес којим неуронска мрежа коригује своје тежине као одговор на повратне информације примљене током фазе обуке. Ради тако што шири, односно пропагира грешку из излазног слоја назад кроз мрежу, тако да сваки неурон може да исправи, односно коригује своју тежину у складу с тим. Итеративна адаптација тежина заснована на повратним информацијама омогућава мрежи да постепено побољшава тачност својих предвиђања и очекиваних резултата.
Разумијевање различитих типова неуронских мрежа
Постоје различите врсте неуронских мрежа, од којих је свака дизајнирана да постигне изванредан успјех у обављању унапријед дефинисаних задатака, као што су препознавање слике, обрада природног језика или анализа временских серија. Главне врсте вјештачких неуронских мрежа су:
· Ациклична неуронска мрежа (или FNN – Feedforward neural network) је врста вјештачке неуронске мреже у којој информације теку у само једном смјеру, од улазног до излазног слоја. Ова врста мреже се обично користи за обављање задатака као што су препознавање образаца, класификација и регресија.
· Конволуциона неуронска мрежа (или CNN – Convolutional neural network) је, у већини случајева, неуронска мрежа ширења напријед дизајнирана за обраду мрежастих података, као што су слике или видео-снимци. Употреба конволуционе неуронске мреже у дубоком учењу ослања се на примјену филтера на локализоване регионе улазних података, омогућавајући јој да систематски учи хијерархијске структуре репрезентације визуелних карактеристика. CNN-ови су постали неопходан алат у класификацији слика, детекцији објеката и задацима рачунарског вида.
· Повратна неуронска мрежа (или RNN – Recurrent neural network), односно рекурентна неуронска мрежа је дизајнирана да обрађује секвенцијалне податке кроз повратне петље. Овај механизам омогућава мрежи да задржи информације из претходних улаза за предвиђања или одлуке. RNN се увелико користи за обављање задатака као што су моделовање језика, препознавање говора и машинско превођење.
· Резидуална неуронска мрежа (или ResNet - Residual neural network) је посебна врста мреже ширења напријед која омогућава мрежи да прескочи одређене слојеве, посебно када они не доприносе добијању бољег резултата. Ова врста мреже се увелико користи у извршавању задатака семантичке сегментације, на примјер. ResNet-с су заправо једноставна, али ефикасна техника за обуку дубоких неуронских мрежа.
Поред ових неколико примјера, постоји много других модела неуронских мрежа који имају мноштво примјена, као што су генерисање синтетичких података, визуелизација података и екстракција и симулација карактеристика. Радијалне неуронске мреже, на примјер, често се користе за обављање задатака апроксимације функција и класификације, посебно када су односи између улаза и излаза сложени или нелинеарни. Постоје и графиконске неуронске мреже које могу да се користе за анализу података садржаних у графовима.
Како се тренирају неуронске мреже?
Обука, односно тренинг неуронске мреже ширења напријед састоји се од корекције тежина повезаних са сваком везом између неурона. Овај процес захтијева скупове података који ће служити као примјери из којих мрежа учи обрасце, корелације и даје тачна предвиђања. Квалитет и разноврсност података за обуку игра виталну улогу у способности мреже да генерализује и даје добре резултате из нових података.
Међутим, треба напоменути да тренинг модела неуронске мреже укључује одређена унутрашња ограничења:
· Захтјеви података: Обука неуронске мреже захтијева велике количине означених података, који нису увијек лако доступни.
· Интерпретабилност: Неуронске мреже се често називају „црним кутијама“ због високе димензионалности (сложености података) на које се примјењују прорачуни, што отежава тумачење разлога који стоје иза донесених одлука.
· Рачунарски ресурси: Тренирање AI неуронских мрежа може бити веома компјутерски интензивно и стога захтијева значајне рачунарске ресурсе и много времена. Други ресурси током фазе увођења су такође неопходни.
· Претренираност и подтренираност, односно пренаученост и поднаученост: Неуронске мреже могу да буду склоне претренираности, када постану превише специфичне за податке о обуци и не успију да добро генералишу нове и невидљиве податке. Супротно томе, када модел не успије да ухвати значајне разлике и обрасце у подацима и стога даје лоше резултате чак и на подацима о обуци, то се назива „подтренираност“.
Предности и недостаци неуронских мрежа
Без обзира на архитектуру неуронских мрежа, ова технологија је већ од пресудне важности због своје способности да учи обрасце, прилагођава се промјенама, извршава више радњи истовремено и обрађује велике количине неорганизованих података. Главне предности неуронских мрежа су:
· Већа прецизност: Неуронске мреже могу да открију сложене обрасце који би могли да промакну људском оку или систему заснованом на правилима
· Прилагодљивост: Неуронске мреже могу да се прилагоде промјенљивим обрасцима тако што ће континуирано учити из нових података.
· Скалабилност: Неуронске мреже могу ефикасно да обрађују велике количине података, што их чини идеалним за обраду у реалном времену.
Међутим, док се неуронске мреже показују као неоспорно моћни алати који су трансформисали многе индустријске секторе, као и код сваке технологије, и она долази уз одређене тешкоће и ограничења. Стога је императив да се у потпуности разумију ове тешкоће да би се максимално искористио њихов пуни потенцијал.
Прво, неуронске мреже захтијевају скупове података да би научиле и дале тачна предвиђања. Квалитет и репрезентативност ових података су од суштинског значаја за добре перформансе мреже. Међутим, стицање и припрема ових скупова података може бити дуготрајан процес за који су потребни вријеме и знатни ресурси.
Друго, дизајн и оптимизација неуронских мрежа захтијевају одређену стручност и велику рачунарску снагу. Избор одговарајуће архитектуре, прилагођавање хиперпараметара и обука модела може бити сложен и итеративни процес. Због ове сложености, чак и стручњацима може бити тешко да ефикасно имплементирају и примјењују неуронске мреже.
Примјена неуронских мрежа такође може да наиђе на одређена ограничења, као што је интерпретабилност. Због њихове сложености, процес доношења одлука у неуронској мрежи може бити тешко разумјети и објаснити. Недостатак интерпретабилности може бити проблем у критичним апликацијама, као што су здравство и финансије, гдје су транспарентност и одговорност од суштинског значаја.
Ка снажним AI мрежама
Важно је процијенити снагу неуронске мреже да би се обезбиједило да системи вјештачке интелигенције одржавају исти високи ниво перформанси у свим околностима. Системи неуронских мрежа представљају посебне изазове зато што их је тешко објаснити и зато што су склони неочекиваном понашању због своје нелинеарне природе. За превазилажење ових ограничења и тешкоћа потребно је примијенити алтернативне приступе попут употребе међународних стандарда.
Серија стандарда ISO/IEC 24029 примјењује холистички приступ тако што рјешава и етичка питања и ограничења у вези с новим технологијама да би се омогућило одговорно усвајање неуронских мрежа. За сада се у текстовима стандарда даје општи преглед и методологија за употребу формалних метода да би се оцијенила својства робусности неуронских мрежа. Ова серија важних стандарда, која је још у развоју, може да послужи као основ за јачање повјерења у системе вјештачке интелигенције широм свијета.
Технички извјештај ISO/IEC TR 24029-1[1] Оцјењивање робусности неуронских мрежа – Дио 1: Преглед;
Стандард ISO/IEC 24029-2 Оцјењивање робусности неуронских мрежа – Дио 2: Методологија за коришћење формалних метода.
Да ли су неуронске мреже будућност вјештачке интелигенције?
Напредак у области неуронских мрежа нуди бескрајне могућности за креативно рјешавање проблема, али развој ове технологије мора бити одговоран, промишљен и да обезбиједи заштитне мјере. Као и свака технологија вјештачке интелигенције, неуронске мреже морају да се развијају у складу с принципима етике и одговорности да би подржале људски напредак с минималним ризиком.
Међународни стандарди могу да помогну истраживачима, регулаторним органима, корисницима и другим заинтересованим странама да се договоре о потребама, начину праћења напретка и најбољим праксама. Иако су предности које већ видимо јасне за, на примјер, болнице или нашу удобност код куће, и даље је од суштинског значаја да се обезбиједи да су питања безбједности, приватности и транспарентности у потпуности интегрисана у развој ове технологије. Дакле, кроз заједнички језик, заједничка мјерила и јединствену визију моћи ћемо максимално искористити потенцијал неуронских мрежа у интересу свих нас.
[1] Институт за стандардизацију БиХ је објавио технички извјештај BAS ISO/IEC TR 24029-1:2022, Умјетна интелигенција (АI) - Процјена робустности неуронских мрежа - Дио 1: Преглед