PPT上写错了,是Lecture 8
and from Wikipedia
In statistics, a likelihood function (often simply the likelihood) is a function of the parameters of a statistical model.
The likelihood of a set of parameter values, θ, given outcomes x, is equal to the probability of those observed outcomes given those parameter values, that is $$\mathcal{L}(\theta |x) = P(x | \theta).$$ The likelihood function is defined differently for discrete and continuous probability distributions.
对于这里来说,f就是outcomes x,$p(f|e)$就是likelihood function, $f$就是上式中的$x$,$e$就是上式中的$\theta$
$$L(french|english) = P(english|french)$$之所以不直接估计P(e|f),主要有两个原因:(1) 可以将e和f分别看作是疾病和症状,那么从e推出f(P(f|e))比较可行,而很难从f推出e(P(e|f))。(2) 引入P(e),这样翻译出来的语句更像人话。
疾病的例子用来理解Bayes rule本身是非常好的,但来解释这个过于牵强。(疾病用来解释贝叶斯:医生在判断是什么病的时候默认进行了贝叶斯公式的转换,转换成了likelihood(感冒会导致发烧的概率) * prior(感冒的概率)。第二个理由比较认同。这里的目标p(english|french)是要完成一句话的转换,都是解剖成每个单词(或是短语)的概率p(french|english),因此,language model(p(e))就很有用了,可以保证说的话符合目标语言的习惯。
举个中文的例子,“这是好的”翻译成"This is great"和"Here is well"
In [ ]: