Liburutegia - Fitxa ikusi   Atal honi buruz gehiago jakiteko

Agur-bertsoetako egitura diskurtsiboaren xerka : ikasketa automatikoaren zein erregela linguistikoen bidezko hurbilketa sailkatzailea

Dokumentua: Euskara, Ingelesa. Online Liburutegian
Egilea(k)
Osinalde, Mikel
Izenburua
Agur-bertsoetako egitura diskurtsiboaren xerka : ikasketa automatikoaren zein erregela linguistikoen bidezko hurbilketa sailkatzailea / Mikel Osinalde Agirre ; tutoreak, Bertol Arrieta eta Mikel Lersundi ; laguntzaile eta eragilea, Aitzol Astigarraga
Argitalpena
2013-09
Edukia
Online
Gaiak
Bertsolaritza
Beste egileak
Arrieta, Bertol ; Astigarraga Pagoaga, Aitzol ; Euskal Herriko Unibertsitatea (EHU) ; Lersundi, Mikel
Deskribapen fisikoa
82 or. : ir.
Informazio formatua
Dokumentua
Eduki mota
Master Amaierako Lana
Oharrak
Euskal Herriko Unibertsitateko Master Amaierako Lana.
Azalean: Universidad del País Vasco = Euskal Herriko Unibertsitatea, Hizkuntzaren Azterketa eta Prozesamendua Masterreko titulua lortzeko bukaerako proiektua
Testuak euskaraz eta ingelesez.
Erreferentzia bibliografikoak: 81-82 or.
Bat-bateko bertsogintzan agur-bertsoek atal beregaina osatzen dute, baina elkarrekin partekatzen duten ezaugarririk ba ote dute? Ba al dago ezaugarri horietan oinarrituta bertso mota horren egitura narratibo jakina edo askotarikoari antzematerik? Galdera horien erantzunaren bila dihardu honako lanak, zeinak azterketa eta sailkapen helburuak besarkatzen dituen. Horretarako, bide-buruan jarri eta bi norantzatan ekin diogu azterketa lanari. Batik bat testu-sailkapen automatikorako teknikekin osatu da esperimentuen multzo nagusia. Bagenuen aurreuste bat, hots, ezaugarri linguistikoak baliatuta emaitza onak lor genitzakeela. Alabaina, ikasketa automatikorako teknikek sailkatzaile egokiak bilatzeko eskain ziezaguketen laguntza egiaztatzen saiatu gara. Bertsoak egoki sailkatze aldera gai-kategoriatzat proposatu ditugu zenbait erreferente eta ideia; ondoren, aztergai ditugun hainbat bertso sorta analizatzeko baliatu ditugu aurrez zehaztutako kategoria horiek, egin ere, ikasketa automatikoko teknikak erabilita. Naive Bayes, k-NN, BayesNet, Support Vector Machines eta Decision Tree Learner sailkatze- algoritmoak hautatu ditugu eginkizuna burutzeko. Orobat, dimentsio-murrizte teknikak ezarri izan dira terminoek osatzen zuten eremua mehaztu eta egokitze aldera. Esperimentuetan erdietsitako emaitzek proposatutako hurbilketaren egokitasuna erabat baztertzen ez duten arren, bidea findu beharra iradokitzen dute eta aukera berrietarako abiapuntua zedarritzen. Bestalde, hasierako usteei oinarri sendoagoak ezartzeko aukera ere izan dugu. Etiketatutako bertso-puntuen behaketaren ostean, klaseak harrapatzeko zenbait hizkuntza-ezaugarri partekatu erauzi ditugu. Ondoren haien gainean erregelak sortu, eta azkenik, aurretiaz burututako lanaren pareko emaitzak lortzeko gai izan garela egiaztatu dugu
1 Sarrera ...8
1.1 Lanaren nondik norakoak ...8
2 Ikergaia zehazten ...9
2.1 Ahozko jarduerak aztertzeko bertsolaritza oinarri ...9
2.2 Ikerketa-ikuspegiak, zeruertza eta usteak ...12
2.2.1 Diskurtsoaren analisia ...14
2.2.2 Oinarrizko unitatearen eta kategoria-sistemaren bila ...15
2.2.2.1 Alexis Díaz-Pimienta, Inprobisazio poetikoaren barne-dinamikaz ...18
2.2.2.2 Guillermo Velazquez, Inprobisazioa ...18
2.2.2.3 Brahim Baouch, Poesia benetako balioen bultzatzaile gisa ...18
2.2.2.4 Aristoteles, Erretorika ...19
2.2.3 Agur-bertsoetako puntuetan antzemateko atributuak ...19
2.3 Ikasketa automatikoa ...21
2.3.1 Testu-kategorizazioa ...21
2.4 Erregeletan oinarritutako hurbilketa ...22
2.4.1 Ezaugarri linguistikoak ...22
3 Esperimentu-saioak ...24
3.1 Ikasketa automatikoko tekniken sailkapena ...24
3.2 Aurre-prozesatze lanak ...24
3.3 Ikasketa-algoritmoak ...26
3.3.1 K-nearest neighbor (Ibk) ...27
3.3.2 Naive Bayes (NB) ...27
3.3.3 Sailkapen zuhaitzak (J48) ...28
3.3.4 Support Vector Machines (SMO) ...29
3.4 Tf-Idf (term frequency-inverse document frequency) ...30
3.5 Multi-sailkatzaileak ...30
3.6 Esperimentuetan erabilitako tresna (WEKA) ...31
3.7 Corpusa ...31
3.8 Ebaluaziorako neurriak ...32
3.9 Emaitzen deskribapena ...35
3.9.1 Ahalegin gehigarria terminoen pisuaren arabera (Tf-Idf) ...43
3.9.2 Multi-sailkatzaileekin lortutako emaitzak ...46
3.9.3 Emaitzarik nabarmenenak ...47
4 Erregelekin egindako saioak ...48
4.1 Erabilitako baliabideak ...49
4.2 Erregelak ...50
4.3 Erregela bidezko ahaleginaren emaitza ...52
4.4 Azterketa morfologikoan oinarritutako etiketatzea ...53
5 Ondorioak ...54
5.1 Emaitzen interpretazioa ...54
5.1.1 Saiakera osagarriak ...55
5.2 Aurrera begira egin daitezkeenak ...56
6 Bibliografia ...58
7 Laburduren zerrenda ...62
8 Taulen eta irudien zerrenda ...63
9 Eranskinak ...64
9.1 Programak ...64
9.1.1 PERL programazio-lengoaia ...64
9.1.2 Klase bakoitzarentzat lema poltsa sortzekoa ...64
9.1.3 Lema-poltsa seikotea terminoen TF-Idf pisaketa aintzat hartuta
sortzeko ...65
9.1.4 Lema-poltsa seikotea erregela morfosintaktikoen arabera ...65
9.1.5 Erregelekin lortutako datuak fitxategi erabilgarrian ...66
9.1.6 Puntuei dagozkien etiketa-fitxategiak sortzekoa (erregela
linguistikoen arabera ...66
9.1.7 Zeinahi agur-bertso etiketatzeko programa ...67
9.2 Bertso-puntuetan erauzitako edukia (hastapenak) ...67
9.3 RANLP2013 kongresuan onartutako artikulua ...75

Datu-base honetan eskainitako informazioari buruz jakiteko, kontsultatu lege oharra