2010-12-12 53 views
1

Je dois traduire (ou plutôt, mapper) les mots d'un document en anglais en bengali en utilisant un dictionnaire anglais-bengali. J'ai une énorme collection de ces documents. Quel algorithme dois-je utiliser, et quelle langue? Les documents et le dictionnaire sont des fichiers texte codés en UTF-8. La traduction est naïve et directe, car les mots seront remplacés aveuglément par ce que dit le dictionnaire, qu'il s'agisse d'une signification d'un seul mot, d'une phrase ou d'une phrase.Quel langage de programmation, algorithme devrais-je utiliser pour la traduction de dictionnaire?

Répondre

1

Vous pouvez utiliser n'importe quel langage courant que vous voulez. Vérifiez simplement quel type de support il a pour unicode et s'il a une structure de données associative intégrée (par exemple stl::map en C++, HashMap/TreeMap en Java, dict en Python etc.). À peu près n'importe quelle langue moderne les a, ou a une bibliothèque librement disponible pour eux.

1

Pratiquement toutes les langues courantes. Si le temps est court je resterais avec python. Si vous avez le temps et que vous voulez faire de l'argent avec vos compétences de codage (si vous avez choisi de les développer) Je voudrais aller avec C#

+0

Pourriez-vous également suggérer l'algorithme à utiliser; une recherche directe de table de hachage? – rup

+0

Un dictionnaire simple est tout ce dont vous avez besoin :) http://msdn.microsoft.com/en-us/library/xfhwa508.aspx – basarat