Jau vairākkārt šajā emuārā esmu rakstījis, ka mašīntulkošanas sistēmas mācās kā tulkot no iepriekš pārtulkotiem tekstiem un arī vienkārši no tekstiem izejas valodā. Citiem vārdiem, jo vairāk pārtulkota angļu-latviešu teksta (un arī vienkārši latviešu teksta) sistēma ir redzējusi, jo labāk tā tulko. Vienkārši, vai ne?
Bet tas nemaz nav vienkrši savākt daudz, daudz šādu tekstu. Runa ir par daudziem miljoniem teikumu.
Eiropas Komisija ir atbalstījusi pētniecisku projektu ACCURAT (http://www.accurat-project.eu), kurā tiek pētītas metodes, kā mašīntulkošanai noderīgus datus atrast internetā. Visiem ir zināms, ka internetā ir ļoti daudz informācijas, liela daļa no tās ir tulkota vai vismaz aptuveni aprakstīta vairākās valodās. ACCURAT projkektā tiek izstrādātas metodes, kuras ļaus internetā atrast paralēlus vai vismaz līdzīgus tekstus vairākās valodās.
Jau pašlaik, tulkotāja translate.tilde.lv uzlabošanai, mēs nepārtraukti automatiski vācam tekstu no interneta. Tiek vākti gan tulkoti teksti, gan vienkārši teksti latviešu valodā.
Mēs esam apzinājuši desmitiem labu informācijas avotu internetā, kuros mēs ikdienas atrodam daudz jaunu un kvalitatīvu tekstu latviešu valodā. Piemēram, ziņu portāli, laikrakstu mājaslapas u.tml.
Gribam dot iespēju arī jums piedalīties ar savu pienesumu mašīntulkošanas attīstībā. Katrs taču zina vairākas labas vietas internetā, kurās regulāri ielūkojas, jo tajās regulāri parādās jauna informācija. Aicinu padalīties ar informāciju un mašīntulks kļūs labāks. Pievienojiet mājaslapu adreses komentāros.
piektdiena, 2010. gada 29. oktobris
ceturtdiena, 2010. gada 21. oktobris
Eiropas patentus tulkos mašīntulks
Tagad projekta LetsMT! nozīmīgumu apliecina Eiropas Padomes dokuments. Tas ir būtisks projekts, kas attīsta jaunas metodes, kuras būs izmantojamas Eiropas patentu mašīntulkošanai. Eiropas padome dalībvalstīm izteikusi oficiālu piedāvājumu ES patentu tulkošanas kārtībai.
Saite uz projekta mājas lapu: http://letsmt.com/
Saite uz projekta mājas lapu: http://letsmt.com/
trešdiena, 2010. gada 20. oktobris
Tildes mašīntulkošanas projekti LISA konferencē
Sabiedrība Tilde pārstāvēta konferencē un izstādē LISA (Localization Industry Standarts Associaton) Budapeštā gan konferences satura komitejā, gan ar uzstāšanos. Tās laikā tika prezentēti tādi ievērojami projekti kā LetsMT!, par kuru lielu interesi izrādīja Eiropas mazie un vidējie lokalizācijas uzņēmumi. Ievērojama interese un cieņa par paveikto ir arī par Tildes mašīntulkošanas kapacitāti un tehnoloģiju. Konferences dalībnieku ievērību guva arī veiksmīgā sadarbība ar Microsoft Translator.

Attēlā sabiedrības Tilde Baltijas lokalizācijas vadītāja Indra Sāmīte

Attēlā sabiedrības Tilde Baltijas lokalizācijas vadītāja Indra Sāmīte
Tilde dalās pieredzē TAUS pasākumā Portlandē

Sabiedrība Tilde pārstāvēta ievērojamā TAUS (translation automation user society) konferencē ASV pilsētā Portlandē. TAUS sevī apvieno lielākos valodas resursu īpašniekus – Oracle, IBM, Microsoft, Dell, Adobe, kā arī mašīntulkošanas rīku un sistēmu izstrādātājus kā Systran, Multi Corpora un Tilde. TAUS mērķis ir izveidot kolaboratīvu paralēlo korpusu krātuvi, kuru iespējams izmantot dažādu mašīntulkošanas projektu vajadzībām.
Šajā nozīmīgajā konferencē sabiedrību Tilde pārstāvēja Baltijas lokalizācijas direktore Indra Sāmīte un dalījās pieredzē par Tildes ievērojamajiem sasniegumiem kopā ar Microsoft Translator, kā arī LetsMT!, Accurat un TTC projektiem.
Šajā nozīmīgajā konferencē sabiedrību Tilde pārstāvēja Baltijas lokalizācijas direktore Indra Sāmīte un dalījās pieredzē par Tildes ievērojamajiem sasniegumiem kopā ar Microsoft Translator, kā arī LetsMT!, Accurat un TTC projektiem.
ceturtdiena, 2010. gada 14. oktobris
Noslēgusies 4. starptautiskā valodu tehnoloģiju konference Baltic HLT 2010
7.-8.oktobrī Rīgas Juridiskās augstskolas telpās notika 4. starptautiskā valodu tehnoloģiju konference HUMAN LANGUAGE TECHNOLOGIES — THE BALTIC PERSPECTIVE (Baltic HLT 2010). Konferences galvenās tēmas bija valodas resursi un rīki humanitāro zinātņu vajadzībām un automatizētās tulkošanas metodes. Konferenci atklāja LU rektors profesors Mārcis Auziņš, Valsts valodas komisijas priekšsēdētājs prof. Andrejs Veisbergs un LU Matemātikas un informātikas institūta direktors Rihards Balodis-Bolužs. Konferences rīta sēde bija veltīta CLARIN projektam – ar CLARIN projektu iepazīstināja tā koordinators Stevins Krauvers (Utrehtas universitāte) un Baltijas valstu pārstāvji sniedza pārskatu par valodas tehnoloģijām. Pēcpusdienas plenārsēdē prof. Kimmo Koskenniemi sniedza pārskatu par galīgo automātu lietojumu valodu tehnoloģijās. 8. oktobra plenārsēdē Dr. Andreas Eisele iepazīstināja ar mašīntulkošanas iespējām „mazajām” valodām un Dr. Georgs Reims iepazīstināja ar META-NET iniciatīvu.
Konference pulcēja vairāk nekā 70 dalībnieku no Igaunijas, Lietuvas, Latvijas, Norvēģijas, Somijas, Nīderlandes, Francijas un Vācijas. Baltic HLT 2010 organizēja sabiedrība Tilde un Latvijas Universitātes Matemātikas un informātikas institūts. Konference ir kļuvusi par vadošo Baltijas zinātnisko konferenci datorlingvistikas jomā, kura pulcē zinātniekus gan no Baltijas valstīm, gan citām Eiropas valstīm.
Konference pulcēja vairāk nekā 70 dalībnieku no Igaunijas, Lietuvas, Latvijas, Norvēģijas, Somijas, Nīderlandes, Francijas un Vācijas. Baltic HLT 2010 organizēja sabiedrība Tilde un Latvijas Universitātes Matemātikas un informātikas institūts. Konference ir kļuvusi par vadošo Baltijas zinātnisko konferenci datorlingvistikas jomā, kura pulcē zinātniekus gan no Baltijas valstīm, gan citām Eiropas valstīm.
Sīkāka informācija šeit: http://www.lumii.lv/hlt2010/
Abonēt:
Ziņas (Atom)