开发语言:C#
源码大小:34.9M
源码大小:34.9M
核心代码(在nuget上安装 Tesseract)
public string TesseractOCR(Bitmap image) { //Tesseract.Page chi_sim为中文训练数据包 Page page = new TesseractEngine(AppDomain.CurrentDomain.BaseDirectory + @"\tessdata", "chi_sim", EngineMode.Default).Process(PixConverter.ToPix(image)); //释放程序对图片的占用 image.Dispose(); //打印识别率 Console.WriteLine(String.Format("{0:P}", page.GetMeanConfidence())); //打印识别文本 //替换'/n'为'(空)'//替换'(空格)'为'(空)' string s = page.GetText().Replace("\n", "").Replace(" ", ""); Console.WriteLine(s); return s; }
各种语言的训练数据包下载地址https://github.com/tesseract-ocr/tessdata
视频教程,点击进入B站可以看高清视频