In [9]:
!pwd
In [10]:
import sys
sys.path.append('/home/anoop/src/python/indic_nlp_library/src')
In [3]:
from indicnlp.transliterate import itrans_transliterator
from indicnlp.transliterate import unicode_transliterate
from indicnlp.normalize import indic_normalize
In [13]:
print itrans_transliterator.transliterate('chakra', 'itrans',
'devanagari', {'outputASCIIEncoded' : False})
In [19]:
text='jammuH pAk sainyattinR.e .ozhippiccu Sh.e .eTT perkk . parikkeR.hRu atirtta .eTT perkk parikkeRRu. atirtti grAma~N~NaLil ninn AyirattoLa.n per.e .ozhippiccu. jammu atirttiyil yuddhAntarIkShamAN nilanilkkunnat. atirtti grAma~N~NaLeyu.n sainika posRRukaLeyu.n lakShya.nvacc pAkistAnR.e AkramaNa.n tuTarukayAN. jammu kashmIril.e atirtti jillakaLAya kAtva, sAmpa .enniviTa~N~NaLilAN AkramaNa.n naTakkunnat.'
print unicode_transliterate.ItransTransliterator.from_itrans(text,'te')
In [31]:
#mal=u'ജമ്മു: പാക് സൈന്യത്തിന്റെ ഒഴിപ്പിച്ചു ഷെ എട്ട് പേര്ക്ക് . പരിക്കേറ്റു അതിര്ത്ത എട്ട് പേര്ക്ക് പരിക്കേറ്റു. അതിര്ത്തി ഗ്രാമങ്ങളില് നിന്ന് ആയിരത്തോളം പേരെ ഒഴിപ്പിച്ചു. ജമ്മു അതിര്ത്തിയില് യുദ്ധാന്തരീക്ഷമാണ് നിലനില്ക്കുന്നത്. അതിര്ത്തി ഗ്രാമങ്ങളേയും സൈനിക പോസ്റ്റുകളേയും ലക്ഷ്യംവച്ച് പാകിസ്താന്റെ ആക്രമണം തുടരുകയാണ്. ജമ്മു കശ്മീരിലെ അതിര്ത്തി ജില്ലകളായ കാത്വ, സാമ്പ എന്നിവിടങ്ങളിലാണ് ആക്രമണം നടക്കുന്നത്.'
text=u'বারবার সংঘর্ষ-বিরতি চুক্তি লঙ্ঘন করছে পাকিস্তান। মনে রাখতে হবে, ভারতেরও সহ্য করার সীমা আছে। এই মর্মে ইসলামাবাদকে হুঁশিয়ারি দিলেন স্বরাষ্ট্রমন্ত্রী রাজনাথ সিং। ২০১৪ সালে ৫৫০ বার সংঘর্ষ-বিরতি লঙ্ঘন করে সীমান্তে গোলাগুলি চালিয়েছে পাকিস্তান। নতুন বছরের প্রথম তিনদিনে ইতিমধ্যে পাঁচবার তেমন ঘটনা ঘটেছে। যদিও সে-দেশের প্রধানমন্ত্রী নওয়াজ শরিফ, প্রতিরক্ষামন্ত্রী খোয়াজা আসিফ প্রমুখ বলেছেন, ভারতই বিনা প্ররোচনায় হামলা চালাচ্ছে।'
lang='bn'
n=indic_normalize.IndicNormalizerFactory().get_normalizer(lang)
text=n.normalize(text)
print unicode_transliterate.ItransTransliterator.to_itrans(text,lang)
In [28]:
x=u'சென்னை'
for c in x:
print u'{} {:x}'.format(c,ord(c))