In [1]:

    
from NDChild import NDChild
from time import clock
from random import choice
import csv
from datetime import datetime
import os
from sys import argv
from argparse import ArgumentParser
from Sentence import Sentence

#GLOBALS
rate = 0.02
conservativerate = 0.001
numberofsentences = 500000
threshold = .001

#language = "611" #English
language = "584" #French
#language = "2253" #German
#language = "3856" #Japanese

infoFile = open('EngFrJapGerm.txt','rU')

LD = []

def pickASentence(languageDomain):
    
    return choice(languageDomain)

def createLD():
    for line in infoFile:
        [grammStr, inflStr, sentenceStr] = line.split("\t")
        sentenceStr = sentenceStr.rstrip()
        s = Sentence([grammStr, inflStr, sentenceStr]) #constructor creates sentenceList
        if grammStr == language:
            LD.append(s)
        


####   MAIN
createLD()

aChild = NDChild(rate, conservativerate, language)

for i in range(numberofsentences):
    s = pickASentence(LD)
    aChild.consumeSentence(s)
    

print aChild.grammar

        

infoFile.close()









    



{'HIP': 1.2e-322, 'HCP': 1.2e-322, 'AH': 1.2e-322, 'lang': '584', 'ItoC': 1.2e-322, 'PI': 9.345140276969974e-22, 'WHM': 0.9999999999999445, 'VtoI': 0.969281132460676, 'SP': 1.2e-322, 'OPT': 0.5, 'QInv': 1.2e-322, 'TM': 1.2359614206344068e-278, 'NS': 6.74379477243666e-08, 'NT': 6.82548956772854e-15}