Mikel Artetxe Zurutuza
Mikel Artetxe Zurutuza (Zarautz, 1992) euskal informatikaria da.
Mikel Artetxe Zurutuza | |
---|---|
Bizitza | |
Jaiotza | Zarautz, 1992 (31/32 urte) |
Herrialdea | Gipuzkoa, Euskal Herria |
Hezkuntza | |
Heziketa | Euskal Herriko Unibertsitatea Donostiako Informatika Fakultatea |
Tesi zuzendaria | Eneko Agirre Gorka Labaka |
Hizkuntzak | euskara ingelesa gaztelania |
Jarduerak | |
Jarduerak | ikertzailea eta informatikaria |
Enplegatzailea(k) | Euskal Herriko Unibertsitatea Meta Platforms Google DeepMind |
Lan nabarmenak | ikusi
|
Kidetza | Ixa taldea Udako Euskal Unibertsitatea Association for Computational Linguistics Sociedad Española para el Procesamiento del Lenguaje Natural |
mikelartetxe.com | |
- Artikulu hau informatikariari buruzkoa da; beste esanahietarako, ikus «Mikel Artetxe».
Adimen artifizialean lan egiten duen Reka start-up enpresako sortzaileetako bat da. Enpresak punta-puntako hizkuntza-eredu multimodalak eraikitzen ditu. Gainera, Euskal Herriko Unibertsitateko ohorezko ikerlaria da, eta %20ko dedikazioarekin lan egiten du IXA ikerketa taldean. Horren aurretik, FAIR (Meta AI) ikerlaria izan zen. Euskal Herriko Unibertsitateko Informatika Fakultatean egin zuen doktoretza, eta Eneko Agirre eta Gorka Labaka zuzendaritzapean. DeepMind eta FAIRen ere behin aritu zen lanean, eta Googlen birritan.
Bere ikerketa-gai nagusiak hizkuntzaren prozesamendua eta ikasketa automatikoa dira orokorrean, eta hor barruan baliabide urriko hizkuntzen arteko eszenatokiak, hizkuntza arteko errepresentazioen ikasketa eta itzulpen automatiko gainbegiratu gabea bereziki. Azkenaldian hizkuntza-eredu handien gainean lan egiten du.[1][2]
Ibilbidea ikasketetan eta ikerkuntzan
aldatuFacebooken ikerketa-zentroan hasi aurretik Euskal Herriko Unibertsitateko IXA taldean aritu zen, eta oraindik mantentzen du lankidetza talde horrekin.
2012an, informatikako gradua ikasten zuen bitartean, Apertium itzultzaile automatikoaren komunitatearekin lankidetzan aritu izan zen, Google Summer of Code udako ekimenean ere.[3] Ikasleek software libreko proiektuetan parte hartzeko ekimen bat da hori.
Geroago, 2014an, oraindik graduko ikaslea zela, Hizkuntzaren Prozesamendua irakasgaian aurkeztu zuen praktika bat geroago mugikorrerako Mitzuli app ospetsua bihurtu zen.[4] Testua, audio eta irudiak ere itzultzen zituen 50 hizkuntza-bikoteetarako, software librea zen eta 30.000 mila deskarga lortu zituen. Garai hartan Googlek bakarrik eskaintzen zuen zerbitzu hori eta Google-rena ez zen librea.[5][6][7][8][9][10]
2014an bertan aurkeztu zuen gradu-amaierako proiektuan ("Itzulpen-sistema hibridoen eraikuntza EBMT bidezko itzulpen partzialak erabiliz") beste urrats bat egin zuen itzulpen automatikoan. Lanaren helburua itzulpenak hobetzea zen, hainbat testu itzulitan agertzen ziren adibideak erabiliz (ingelesez Example Based Machine Translation, EBMT). Testuko entitateak (pertsona, erakunde edo tokien izenak) eta esaldia baino txikiagoak diren unitate sintaktikoak identifikatu, eta orokortzen zituen hasieran, eta gero datu horiek aurreprozesatu nddoren itzulpen partzial haiek esaldi mailan txertatzen zituen. Itzulpenak egiteko zeuden beste teknikekin (estatistikoekin edota erregeletan oinarritutakoekin) hibridatzeko mekanismo bat ere garatu zuen.[11][12] HAP/LAP masterra egin zuen gero, eta Ixa taldearen lankidetza-beka batekin aritu zen QTLeap proiektu europarrean.
2015an euskarazko eta gaztelaniazko izen+aditz konbinazioei buruzko informazioa biltzen duen Konbitzul datu-basea sortzen parte hartu zuen.[13]
2016an aurkeztu zuen master-tesian Itzulpen Automatikoa hobetzeko helburuarekin aztertu zuen nola txertatu hitzen adierazpen distribuzionala (word embedding) eta ikasketa automatikoa.[14][15][16] Geroago bere ikasketetan zehar Google, DeepMind eta Facebooken[17] bertan egonaldiak egin zituen eta 2020an defendatu zuen Ixa Taldearekin eginiko doktorego-tesia, zuzendariak Eneko Agirre eta Gorka Labaka izan zirela.[18] Doktore-tesiak Espainiako eta Europako tesirik onenaren saria jaso zuen 2021ean. [19][20][21][22]
Itzulpen automatiko gainbegiratu gabea
aldatuSekuentziatik sekuentziarako eredu neuronalaren etorrerak aurrerapen izugarria ekarri zuen itzulpen automatikoan. Horrek hobekuntza handia ekarri zuen itzulpen-sistema estandarretan eta horrela zenbait ingurunetan giza-itzulpenen kalitatearen maila lortu zuten lehenengoz. Hala ere, gaur egun dauden sistemek datu asko behar dute (gainbegiratze sakona), corpus paralelo gisa normalean milioika perpaus behar izaten dituzte. Baina harrigarria da, gizakiak ez du baldintza hori behar hizkuntza bat ikasteko. Eta gainera baldintza horrek arazo praktiko garrantzitsu bat planteatzen du euskara bezalako baliabide gutxiko hizkuntzekin itzulpenak egiteko.
Artetxeren tesiaren helburua datu paraleloen menpekotasun hori guztiz ezabatzea izan zen, corpus elebakarra baino beharko ez zuten “gainbegiratu gabeko itzulpen automatiko”ko sistemak eratzeko. Horretarako, lehenengo urrats batean bi hizkuntzatarako sortutako hitz-bektoreak (word embedding-ak) lerrokatzen zituen, beren arteko egitura-antzekotasunean oinarrituta.[14] Gero, bigarren urrats batean, lerrokatze horren emaitzak erabiltzen zituen itzulpen-sistema neuronal bat edo itzulpen-sistema estatistiko bat hasieratzeko, azken urratsean back-translationaren bidez hobetzen joango dena.[18]
Sariak eta errekonozimenduak
aldatu- 2021: Adimen Artifizialerako Europako Elkarteak tesi onenarentzako saria eman zion (Itzulpen automatiko gainbegiratu gabea / Unsupervised Machine Translation).[23] [20][21]
- Ikertzaile gazteentzako Espainiako Informatika Saria, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman zion nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[24][25] Mikel Artetxek saria jasotzeagatik eman zituen esker-hitzetan jolas dialektiko bat egin zuen teknologiak artean zituen mugak azpimarratzeko.[26]
- 2021: Ikertzaile gazteentzako Espainiako Informatika Saria, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman zion nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[24]
- 2019: Hizkuntzaren prozesamenduko elkarte ospetsuena den ACL kongresuan (Association for Computational Linguistics) artikulu onenerako izendapena jaso zituen.
- 2018: CoNLL nazioarteko kongresuan artikulu onenaren saria.[27][28] Saritutako artikuluaren izenburua hau da: “Uncovering Divergent Linguistic Information in Word Embeddings with Lessons for Intrinsic and Extrinsic Evaluation”. Euskaraz: “Informazio linguistiko dibergentea azaleratzen hitzen bektore-errepresentazio distribuzionaletan, ebaluazio intrinseko eta estrinsekorako zenbait ikasgairekin”.
- 2017: Science aldizkariak albiste moduan jaso zuen Mikel Artetxe, Eneko Agirre and Gorka Labaka Ixakideek 2017ko urrian argitaratu zuten ikerketa bat: Artificial intelligence goes bilingual—without a dictionary. [29][30][16]
- 2017: Bigarren saria Bartzelonan antolatu zen Hizkuntza Teknologietako Hackatoian. Antolatzailea Red.es izan zen, eta SESIAD agentziaren babesa izan zuen. Mikel Artetxe Linguee moduko aplikazioak sortzeko programa bat garatu zuen; testu-corpus batetik abiatuta hiztegi elebidunak sortzeko aplikazio harek testu errealetako adibide errealak eskaintzen zituen hitzaren erabilera zelakoa den hobeto erakustearren. Software librea zen aplikazio hura hainbat hizkuntzatarako erabili ahal da, tartean euskararako.[31]
- 2013-2014 ikasturteko karrera bukaerako sari nazionala ere jaso zuen, estatu mailakoa.[32][33]
- 2014: Mikel Artetxek hirugarren postua lortu zuen Tuenti challange programazio-txapelketan.[34]
- 2014: Domina bat eta 6. postua nazioarteko SWERC programazio-lehiaketan. Donostiako Informatika fakultateko taldeko kideak hauek ziren: Iván Matellanes, Asier Mujika, Mikel Artetxe, Adrián Nuñez, Jon Mediero, eta Eneko Pinzolas. Entrenatzailea Jesus Ibañez Conde irakaslea zen.[35][36]
- 15 artikulu baino gehiago argitaratu ditu punta-puntako nazioarteko kongresu eta aldizkarietan.[37]
Erreferentziak
aldatu- ↑ (Ingelesez) Mikel Artetxe. «Mikel Artetxe» www.mikelartetxe.com (Noiz kontsultatua: 2020-12-02).
- ↑ Artetxe Zurutuza, Mikel. (2024-11-26). Adimen artifizial sortzailea: historiatik eta histeriara?. Udako Euskal Unibertsitatea.
- ↑ (Ingelesez) Artetxe, Mikel. (2012). Google Summer of Code 2012. Application. User. Apertium.
- ↑ «6 ikasle ohiren ikuspuntua // 6 ex-alumn@s: ¿Cómo trabajo en informática?» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
- ↑ Artetxe Zurutuza, Mikel. (2014). Mitzuli app. .
- ↑ Informatika Fakultateko HP hautazko ikasgaia. Lan praktiko batzuk – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ Mitzuli itzultzaileak 10.000 deskarga – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ Euskal Irrati Telebista. (2015-05-09). «Mitzuli, mugikorra itzultzaile bihurtzeko aplikazioa, sortu dute» www.eitb.eus (Noiz kontsultatua: 2020-12-02).
- ↑ «Mitzuli eta Mikel Artetxe» Zientzia.eus 2015-06-01 (Noiz kontsultatua: 2020-12-02).
- ↑ «https://twitter.com/hashtag/mitzuli» Twitter (Noiz kontsultatua: 2020-12-02).
- ↑ Artetxe Zurutuza, Mikel. (2014-07-30). Itzulpen-sistema hibridoen eraikuntza EBMT bidezko itzulpen partzialak erabiliz. (Noiz kontsultatua: 2020-12-02).
- ↑ Gradu bukaerako proiektuak 2014/15 ikasturtean. – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ Euskarazko eta gaztelaniazko izen+aditz konbinazioak lantzen – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ a b Artetxe, Mikel. (2018). Hizkuntzen mapa birtualak. Elhuyar.
- ↑ Bideoa: HAP/LAP master-tesia (Mikel Artetxe) – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ a b ACL. (2017-09-21). Learning bilingual word embeddings with (almost) no bilingual data --- Mikel Artetxe, Gorka Labaka and Eneko Agirre. (Noiz kontsultatua: 2020-12-03).
- ↑ UPV/EHUko doktoregai Mikel Artetxek Facebook beketako bat jaso du. . Campus UPV/EHU.
- ↑ a b Tesia: Itzulpen automatiko gainbegiratu gabea (Mikel Artetxe, 2020-07-29) – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-04-24).
- ↑ Uriarte Atxikallende, Alex. (2021-10-12). ««Batzuetan, merezi du ideia eroak planteatzea»» Berria (Noiz kontsultatua: 2022-04-24).
- ↑ a b «Adimen Artifizialerako Europar Elkarteak Mikel Artetxeren tesia saritu du» sustatu.eus (Noiz kontsultatua: 2022-04-24).
- ↑ a b «Mikel Artetxeren doktore tesia saritu dute Europan» El Correo 2021-08-18 (Noiz kontsultatua: 2022-04-24).
- ↑ SLU, Herritar Berri. (2021-05-24). «Eneko Agirre eta Mikel Artetxe ikertzaileen ibilbideak sarituak Estatu mailan» GAUR8 (Noiz kontsultatua: 2022-04-24).
- ↑ Mikel Artetxeri Europako tesien saria Adimen Artifizialean – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-04-24).
- ↑ a b (Gaztelaniaz) «Fallados los Premios de Investigación Sociedad Científica Informática de España (SCIE) – Fundación BBVA» FBBVA 2021-05-21 (Noiz kontsultatua: 2021-05-21).
- ↑ (Gaztelaniaz) [https://www.fbbva.es/galardonados/mikel-artetxe-zurutuza/ «Mikel Artetxe Zurutuza. PREMIO DE INVESTIGACIÓN SOCIEDAD CIENTÍFICA INFORMÁTICA DE ESPAÑA-FUNDACIÓN BBVA. Investigadores Jóvenes Informáticos, 2021»] FBBVA (FBBVA) (Noiz kontsultatua: 2021-11-19).
- ↑ Espainiako Informatika-Ikerketako Sari bana eman diete Eneko Agirre eta Mikel Artetxeri (elkarrizketak eta esker-hitzak, 2021-11-18) – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-04-24).
- ↑ Artikulu onenaren saria CoNLL2018 biltzarrean – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ Artetxe, Mikel; Labaka, Gorka; Lopez-Gazpio, Iñigo; Agirre, Eneko. (2018-10). «Uncovering Divergent Linguistic Information in Word Embeddings with Lessons for Intrinsic and Extrinsic Evaluation» Proceedings of the 22nd Conference on Computational Natural Language Learning (Association for Computational Linguistics): 282–291. doi: . (Noiz kontsultatua: 2020-12-02).
- ↑ Science aldizkariak: ‘Hiztegirik gabeko itzulpen automatikoa, Ixa taldeak zabaldu duen ikerlerroa’ – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ «Science journal: Machine Translation without a dictionary?» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
- ↑ Mikel Artetxe-k saria jaso du Bartzelonako HP Hackatoian – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
- ↑ «Duque ministroak beren karrera amaierako sariak eman zizkien Mikel Artetxe eta Josué Tonelliri» UPV/EHU (Noiz kontsultatua: 2020-12-02).
- ↑ Informatika, EHUko. «Mikel ARTETXE Karrera Amaierako lehenengo Sari Nazionala / Premio Nacional de Fin de Carrera» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-02).
- ↑ «Mikel Artetxe 3. Tuenti txapelketan» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
- ↑ «Lortu dugu domina bat SWERC txapelketan» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
- ↑ «Mintegia: SWERC programazio-txapelketako kontuak (2015/02/24)» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
- ↑ «Mikel Artetxe» scholar.google.com (Noiz kontsultatua: 2020-12-03).
Ikus, gainera
aldatuKanpo estekak
aldatuGai honi buruzko informazio gehiago lor dezakezu Scholian |
- (Ingelesez) Webgune pertsonal profesionala. «Mikel Artetxe»
- Mikel Artetxeren aplikazio informatikoak Github-en
- Mikel Artetxe Google Scholarren (2000 aipamen baino gehiago)
- Mikel Artetxe Mikel Artetxe Linkedin sare profesionalean.
- Zergatik ikasi nuen informatika? Mikel Artetxe. (UPV/EHUko DIFeko ikasle ohien iritziak, (?t=320; 5' 20), Donostiako Informatika Fakultatea, Youtube)
- Wikipedia eta Mikel Artetxe. 2019ko elkarrizketa Aitzol Astigarraga eta Galder Gonzalez wikilariekin, Mikel Artetxe oraindik wikipedian ez zegoela, (sarean.eus, 2019/05/17)