In [1]:
!pwd


/home/user/notebooks/uat_shl/rnd04ocr

In [2]:
!ls -l


total 500
-rw-r--r--. 1 user user    867 Sep 10 23:02 112907.jpg
-rw-r--r--. 1 user user 183523 Sep 10 21:41 ocr.png
-rw-r--r--. 1 user user 217004 Sep 10 21:41 ocr.tif
-rw-rw-r--. 1 user user     10 Sep 10 23:03 out.txt
-rw-r--r--. 1 user user  97736 Sep 10 21:41 tesseract.PNG
-rw-r--r--. 1 user user     72 Sep 10 23:12 Untitled.ipynb

In [3]:
!tesseract ocr.png out -l chi_sim -psm 4 digits


Tesseract Open Source OCR Engine v3.04.01 with Leptonica
Detected 18 diacritics

In [4]:
!cat out.txt


51    

      

2017 4 15                 89400 
    1219 

     52273 .          
    30 1  30         -

     0 11. 00  
    .00 11 30      -300 -200 -100

11  29  55
59400
2011 04 15 11 29 52
59100 59100

    

           51    1     17-8 4   

 


In [ ]: