Identificatore automatico della lingua, 102 lingue supportate

Digita o incolla del testo per identificare la lingua

Scegli una lingua a caso

Lingue supportate:

  • Abkhazian
  • Afrikaans
  • Albanian
  • Arabic
  • Azerbaijani
  • Bosnian
  • Breton
  • Bulgarian
  • Chamorro
  • Chinese
  • Corsican
  • Croatian
  • Czech
  • Danish
  • Dutch
  • English
  • Esperanto
  • Estonian
  • Ewe
  • Faroese
  • Fijian
  • Finnish
  • French
  • Frisian
  • Georgian
  • German
  • Greek
  • Haitian
  • Hausa
  • Hebrew
  • Hindi
  • Hungarian
  • Icelandic
  • Igbo
  • Indonesian
  • Irish
  • Italian
  • Japanese
  • Javanese
  • Kanuri
  • Kashmiri
  • Kazakh
  • Kirghiz
  • Kongo
  • Korean
  • Kurdish
  • Latin
  • Latvian
  • Lingala
  • Lithuanian
  • Luba-Katanga
  • Macedonian
  • Malagasy
  • Malay
  • Maltese
  • Marshallese
  • Navajo
  • Neapolitan (Italian dialect)
  • Nepali
  • Norwegian
  • Persian
  • Polish
  • Portuguese
  • Pushto
  • Quechua
  • Romanian
  • Rundi
  • Russian
  • Samoan
  • Sango
  • Sanskrit
  • Sardinian
  • Serbian
  • Shona
  • Slovak
  • Slovenian
  • Somali
  • Spanish
  • Sundanese
  • Swahili
  • Swedish
  • Tagalog
  • Tahitian
  • Tamil
  • Thai
  • Turkish
  • Ukrainian
  • Urdu
  • Uzbek
  • Vietnamese
  • Walloon
  • Welsh
  • Xhosa
  • Yoruba
  • Zulu

Informazioni sull'identificatore della lingua

Introduzione

Un identificatore della lingua è un classificatore automatico. Calcola la somiglianza di un testo con testi di riferimento precedentemente inseriti.

Perchè lo abbiamo sviluppato?

Questa tecnologia è parte integrante di uno spider in grado estrarre dal web informazioni utili ai nostri traduttori.

Lo utilizziamo anche per verificare di non aver lasciato frasi non tradotte in un progetto e per migliorare l'usabilità delle interfacce web come il nostro traduttore automatico

Essendo un classificatore automatico, può essere facilmente usato per dire a quale categoria appartenga un documento fornendogli dei documenti di esempio. Per questo lo utilizziamo anche per classificare la nostra corrispondenza e per identificare l'argomento di un testo scritto in una lingua che non capiamo.

Tecnologia

Crea una rappresentazione n-dimensionale del testo (Vector Space Model) utilizzando come coordinate proprietà statistiche delle sequenze di byte trovate nel testo. Fa la stessa operazione sui testi di riferimento precedentemente inseriti. Nello spazio n-dimensionale, il testo inserito avrà una posizione precisa. Il testo di riferimento a lui più vicino sarà quello che più gli assomiglia.

Lo voglio!

Se questa tecnologia ti interessa ti invitiamo a leggere di più sui Translated Labs e sui nostri servizi per il trattamento automatico della lingua.

So fare di meglio!

Se pensi di poter migliorare questi applicativi, sei appassionato di information retrieval, natural language processing, machine learning o più in generale di intelligenza artificiale, hai trovato il posto giusto dove lavorare. Mandaci un cv