Introduzione
Un identificatore della lingua è un classificatore automatico.
Calcola la somiglianza di un testo con testi di riferimento precedentemente inseriti.
Perchè lo abbiamo sviluppato?
Questa tecnologia è parte integrante di uno spider in grado estrarre dal web informazioni utili ai nostri traduttori.
Lo utilizziamo anche per verificare di non aver lasciato frasi non tradotte in un progetto e per migliorare l'usabilità delle interfacce web come il nostro traduttore automatico
Essendo un classificatore automatico, può essere facilmente usato per dire a quale categoria appartenga un documento fornendogli dei documenti di esempio.
Per questo lo utilizziamo anche per classificare la nostra corrispondenza e per identificare l'argomento di un testo scritto in una lingua che non capiamo.
Tecnologia
Crea una rappresentazione n-dimensionale del testo (Vector Space Model) utilizzando
come coordinate proprietà statistiche delle sequenze di byte trovate nel testo. Fa la stessa operazione sui testi di riferimento precedentemente inseriti.
Nello spazio n-dimensionale, il testo inserito avrà una posizione precisa. Il testo di riferimento a lui più vicino sarà quello che più gli assomiglia.
Lo voglio!
Se questa tecnologia ti interessa ti invitiamo a leggere di più sui
Translated Labs e sui nostri servizi per il
Trattamento automatico della lingua.
So fare di meglio!
Se pensi di poter migliorare questi applicativi, sei appassionato di information retrieval, natural language processing, machine learning o più in generale di intelligenza artificiale, hai trovato il posto giusto dove lavorare.
Mandaci un cv