当前位置：首页 > 编程日记 > 正文

OpenCV支持中文字符输出实现

编程日记 2024-12-19 09:00:00

在 http://www.opencv.org.cn/forum.php?mod=viewthread&tid=2083&extra=&page=1 中，作者给出了原始的在OpenCV中支持中文字符的输入，原始的实现使用的是OpenCV的C接口，使用起来不怎么方便，这里对原作者的实现进行调整，通过OpenCV的C++接口实现中文的输出，调整后的code如下：

CvxText.hpp:

#ifndef OPENCV_CVX_TEXT_HPP_
#define OPENCV_CVX_TEXT_HPP_// source from: http://www.opencv.org.cn/forum.php?mod=viewthread&tid=2083&extra=&page=1
// 支持OpenCV中文汉字输入#include <ft2build.h>
#include FT_FREETYPE_H#include <opencv2/opencv.hpp>class CvxText {
public:/*** 装载字库文件*/CvxText(const char* freeType);virtual ~CvxText();/*** 获取字体.目前有些参数尚不支持.** \param font        字体类型, 目前不支持* \param size        字体大小/空白比例/间隔比例/旋转角度* \param underline   下画线* \param diaphaneity 透明度** \sa setFont, restoreFont*/void getFont(int* type, cv::Scalar* size=nullptr, bool* underline=nullptr, float* diaphaneity=nullptr);/*** 设置字体.目前有些参数尚不支持.** \param font        字体类型, 目前不支持* \param size        字体大小/空白比例/间隔比例/旋转角度* \param underline   下画线* \param diaphaneity 透明度** \sa getFont, restoreFont*/void setFont(int* type, cv::Scalar* size=nullptr, bool* underline=nullptr, float* diaphaneity=nullptr);/*** 恢复原始的字体设置.** \sa getFont, setFont*/void restoreFont();/*** 输出汉字(颜色默认为黑色).遇到不能输出的字符将停止.** \param img  输出的影象* \param text 文本内容* \param pos  文本位置** \return 返回成功输出的字符长度，失败返回-1.*/int putText(cv::Mat& img, const char* text, cv::Point pos);/*** 输出汉字(颜色默认为黑色).遇到不能输出的字符将停止.** \param img  输出的影象* \param text 文本内容* \param pos  文本位置** \return 返回成功输出的字符长度，失败返回-1.*/int putText(cv::Mat& img, const wchar_t* text, cv::Point pos);/*** 输出汉字.遇到不能输出的字符将停止.** \param img   输出的影象* \param text  文本内容* \param pos   文本位置* \param color 文本颜色** \return 返回成功输出的字符长度，失败返回-1.*/int putText(cv::Mat& img, const char* text, cv::Point pos, cv::Scalar color);/*** 输出汉字.遇到不能输出的字符将停止.** \param img   输出的影象* \param text  文本内容* \param pos   文本位置* \param color 文本颜色** \return 返回成功输出的字符长度，失败返回-1.*/int putText(cv::Mat& img, const wchar_t* text, cv::Point pos, cv::Scalar color);private:// 禁止copyCvxText& operator=(const CvxText&);// 输出当前字符, 更新m_pos位置void putWChar(cv::Mat& img, wchar_t wc, cv::Point& pos, cv::Scalar color);FT_Library   m_library;   // 字库FT_Face      m_face;      // 字体// 默认的字体输出参数int         m_fontType;cv::Scalar   m_fontSize;bool      m_fontUnderline;float      m_fontDiaphaneity;
};#endif // OPENCV_CVX_TEXT_HPP_

CvxText.cpp:

#include <wchar.h>
#include <assert.h>
#include <locale.h>
#include <ctype.h>
#include <cmath>#include "CvxText.hpp"// 打开字库
CvxText::CvxText(const char* freeType)
{assert(freeType != NULL);// 打开字库文件, 创建一个字体if(FT_Init_FreeType(&m_library)) throw;if(FT_New_Face(m_library, freeType, 0, &m_face)) throw;// 设置字体输出参数restoreFont();// 设置C语言的字符集环境setlocale(LC_ALL, "");
}// 释放FreeType资源
CvxText::~CvxText()
{FT_Done_Face(m_face);FT_Done_FreeType(m_library);
}// 设置字体参数:
//
// font         - 字体类型, 目前不支持
// size         - 字体大小/空白比例/间隔比例/旋转角度
// underline   - 下画线
// diaphaneity   - 透明度
void CvxText::getFont(int* type, cv::Scalar* size, bool* underline, float* diaphaneity)
{if (type) *type = m_fontType;if (size) *size = m_fontSize;if (underline) *underline = m_fontUnderline;if (diaphaneity) *diaphaneity = m_fontDiaphaneity;
}void CvxText::setFont(int* type, cv::Scalar* size, bool* underline, float* diaphaneity)
{// 参数合法性检查if (type) {if(type >= 0) m_fontType = *type;}if (size) {m_fontSize.val[0] = std::fabs(size->val[0]);m_fontSize.val[1] = std::fabs(size->val[1]);m_fontSize.val[2] = std::fabs(size->val[2]);m_fontSize.val[3] = std::fabs(size->val[3]);}if (underline) {m_fontUnderline   = *underline;}if (diaphaneity) {m_fontDiaphaneity = *diaphaneity;}FT_Set_Pixel_Sizes(m_face, (int)m_fontSize.val[0], 0);
}// 恢复原始的字体设置
void CvxText::restoreFont()
{m_fontType = 0;            // 字体类型(不支持)m_fontSize.val[0] = 20;      // 字体大小m_fontSize.val[1] = 0.5;   // 空白字符大小比例m_fontSize.val[2] = 0.1;   // 间隔大小比例m_fontSize.val[3] = 0;      // 旋转角度(不支持)m_fontUnderline   = false;   // 下画线(不支持)m_fontDiaphaneity = 1.0;   // 色彩比例(可产生透明效果)// 设置字符大小FT_Set_Pixel_Sizes(m_face, (int)m_fontSize.val[0], 0);
}// 输出函数(颜色默认为白色)
int CvxText::putText(cv::Mat& img, const char* text, cv::Point pos)
{return putText(img, text, pos, CV_RGB(255, 255, 255));
}int CvxText::putText(cv::Mat& img, const wchar_t* text, cv::Point pos)
{return putText(img, text, pos, CV_RGB(255,255,255));
}int CvxText::putText(cv::Mat& img, const char* text, cv::Point pos, cv::Scalar color)
{if (img.data == nullptr) return -1;if (text == nullptr) return -1;int i;for (i = 0; text[i] != '\0'; ++i) {wchar_t wc = text[i];// 解析双字节符号if(!isascii(wc)) mbtowc(&wc, &text[i++], 2);// 输出当前的字符putWChar(img, wc, pos, color);}return i;
}int CvxText::putText(cv::Mat& img, const wchar_t* text, cv::Point pos, cv::Scalar color)
{if (img.data == nullptr) return -1;if (text == nullptr) return -1;int i;for(i = 0; text[i] != '\0'; ++i) {// 输出当前的字符putWChar(img, text[i], pos, color);}return i;
}// 输出当前字符, 更新m_pos位置
void CvxText::putWChar(cv::Mat& img, wchar_t wc, cv::Point& pos, cv::Scalar color)
{// 根据unicode生成字体的二值位图FT_UInt glyph_index = FT_Get_Char_Index(m_face, wc);FT_Load_Glyph(m_face, glyph_index, FT_LOAD_DEFAULT);FT_Render_Glyph(m_face->glyph, FT_RENDER_MODE_MONO);FT_GlyphSlot slot = m_face->glyph;// 行列数int rows = slot->bitmap.rows;int cols = slot->bitmap.width;for (int i = 0; i < rows; ++i) {for(int j = 0; j < cols; ++j) {int off  = i * slot->bitmap.pitch + j/8;if (slot->bitmap.buffer[off] & (0xC0 >> (j%8))) {int r = pos.y - (rows-1-i);int c = pos.x + j;if(r >= 0 && r < img.rows && c >= 0 && c < img.cols) {cv::Vec3b pixel = img.at<cv::Vec3b>(cv::Point(c, r));cv::Scalar scalar = cv::Scalar(pixel.val[0], pixel.val[1], pixel.val[2]);// 进行色彩融合float p = m_fontDiaphaneity;for (int k = 0; k < 4; ++k) {scalar.val[k] = scalar.val[k]*(1-p) + color.val[k]*p;}img.at<cv::Vec3b>(cv::Point(c, r))[0] = (unsigned char)(scalar.val[0]);img.at<cv::Vec3b>(cv::Point(c, r))[1] = (unsigned char)(scalar.val[1]);img.at<cv::Vec3b>(cv::Point(c, r))[2] = (unsigned char)(scalar.val[2]);}}}}// 修改下一个字的输出位置double space = m_fontSize.val[0]*m_fontSize.val[1];double sep   = m_fontSize.val[0]*m_fontSize.val[2];pos.x += (int)((cols? cols: space) + sep);
}

测试代码如下：

#include "funset.hpp"
#include <iostream>//It contains various macro declarations that are later used to #include the
//appropriate public FreeType 2 header files.
#include <ft2build.h>
//FT_FREETYPE_H is a special macro defined in file ftheader.h. It contains some
//installation-specific macros to name other public header files of the FreeType 2 API.
#include FT_FREETYPE_H
#include <ftglyph.h>#include <opencv2/opencv.hpp>#include "CvxText.hpp"int test_opencv_support_chinese_text()
{cv::Mat mat = cv::imread("E:/GitCode/OCR_Test/test_data/lena.png", 1);if (!mat.data || mat.channels() != 3) {fprintf(stderr, "read image fail\n");return -1;}CvxText text("E:/GitCode/OCR_Test/test_data/simhei.ttf"); //指定字体cv::Scalar size1{ 100, 0.5, 0.1, 0 }, size2{ 100, 0, 0.1, 0 }, size3{ 50, 0, 1, 0 }, size4{50, 0, 0.1, 0}; // (字体大小, 无效的, 字符间距, 无效的 }text.setFont(nullptr, &size1, nullptr, 0);text.putText(mat, "中国", cv::Point(50, 100));text.setFont(nullptr, &size2, nullptr, 0);text.putText(mat, "北京", cv::Point(50, 200), cv::Scalar(255, 0, 0));text.setFont(nullptr, &size3, nullptr, 0);text.putText(mat, "China", cv::Point(50, 250), cv::Scalar(0, 255, 0));text.setFont(nullptr, &size4, nullptr, 0);text.putText(mat, "BeiJing", cv::Point(50, 300), cv::Scalar(0, 0, 255));cv::imwrite("E:/GitCode/OCR_Test/test_data/result_lena.png", mat);return 0;
}

测试结果如下：

GitHub： https://github.com/fengbingchun/OCR_Test

https://www.dkcj.cn/info/32486.html

CSDN”原力计划“在召唤：技术人请集结，用原创技术影响万千开发者

技术深不可测、薪资难以想象、着装招人吐槽、发量让人惊叹、笑点着实密集、情商令人堪忧......在这个你我他她它通过网络紧密互联、消息实时互通的 21 世纪，人们对身处技术至高点的程序员们仍然有着以上不接地气、呆板保守的误解，对此，操着一…

编程日记2024/12/19 08:50:00

.asmx支持post请求或者get请求调用(WebService 因 URL 意外地以结束，请求格式无法识别的解决方法)...

使用Post调用以asmx形式提供的webservice时，在本机调试没有调用问题。一旦部署至服务器后会提示如下信息： <html><head><title>因 URL 意外地以“/GetCertByToken”结束，请求格式无法识别。</title><meta name&qu…

编程日记2024/12/19 08:40:00

关于StartCoroutine的简单线程使用

StartCoroutine在unity3d的帮助中叫做协程，意思就是启动一个辅助的线程。在C#中直接有Thread这个线程，但是在unity中有些元素是不能操作的。这个时候可以使用协程来完成。使用线程的好处就是不会出现界面卡死的情况，如果有一次非常大量的运…

编程日记2024/12/19 08:30:00

Robot Framework（十八）支持工具

5支持工具 5.1库文档工具（libdoc） libdoc是一种用于为HTML和XML格式的测试库和资源文件生成关键字文档的工具。前一种格式适用于人类，后者适用于RIDE和其他工具。Libdoc也没有很少的特殊命令来显示控制台上的库或资源信息。可以创建文档&…

编程日记2024/12/19 08:20:00

基于开源TiRG的文本检测与提取实现

在 http://funkybee.narod.ru/ 中作者给出了文本检测和提取的实现，仅有一个.hpp文件，为了在windows上编译通过，这里简单进行了改动，改动后的code如下： #include <math.h> #include <stdio.h> #include &l…

编程日记2024/12/19 08:10:00

Kaggle Days首次落地中国，日本团队拿下冠军

2019 年 10 月 20 日， 为期两天的 Kaggle Days 中国活动在北京圆满结束。作为全球最知名的线下数据科学活动在中国的首次落地，Kaggle Days 获得了谷歌、Kaggle 以及 16 位来自美国、俄罗斯、捷克、日本以及中国的 Kaggle Grandmaster 以及 Master 的大力…

编程日记2024/12/19 08:00:01

activity的四种加载模式

在android里，有4种activity的启动模式，分别为： standard, singleTop, singleTask和singleInstance, 其中standard和singleTop类似， singleTask和singleInstance类似， 用法如下： (1).standard和singleTop 这…

编程日记2024/12/19 07:40:00

吴恩达老师深度学习视频课笔记：优化算法

优化算法能够帮助你快速训练模型。mini-batch梯度下降法：把训练集分割(split)为小一点的子训练集，这些子集被叫做mini-batch。batch梯度下降法指的是：同时处理整个训练集，只有处理完整个训练集才更新一次权值和偏置。并且预期每次…

编程日记2024/12/19 07:30:00

程序员编程时戴耳机是在听什么？

1024程序员节，CSDN旗下的码书商店为程序员放个“价”，全场所有书籍8折，电子产品可以拥有大额优惠券，购买前可加文末客服微信领取优惠券哦。兰士顿耳机，原价199元，1024专属价159元，购买时候请输入…

编程日记2024/12/19 07:20:00

Mac中MacPorts安装和使用

文章转载至http://www.zikercn.com/node/8 星期四, 06/07/2012 - 19:02 — 张慧敏 MacPorts简单介绍 MacPorts，以前叫做DarwinPorts，是一个软件包管理系统，用来简化Mac OS X和Darwin操作系统上软件的安装。它是一个用来简化自由软件/开放源码…

编程日记2024/12/19 07:10:00

小白入门：我是如何学好机器学习的？

作者 | Jae Duk Seo译者 | Tianyu编辑 | 夕颜出品 | AI科技大本营（ID: rgznai100）在我看来，机器学习是一个计算机科学和数学知识相融合的研究领域。虽然这是个很有趣的领域，但它其实没有想象中那么难。我相信只要你有足够的动力、…

编程日记2024/12/19 07:00:01

数据库服务器之 PostgreSQL数据库的日常维护工作

来自：LinuxSir.Org摘要：为了保持所安装的 PostgreSQL 服务器平稳运行, 我们必须做一些日常性的维护工作。我们在这里讨论的这些工作都是经常重复的事情， 可以很容易地使用标准的 Unix 工具，比如cron 脚本来实现; 目录1. 综述&…

编程日记2024/12/19 06:50:00

吴恩达老师深度学习视频课笔记：超参数调试、Batch正则化和程序框架

Tuning process(调试处理)：神经网络的调整会涉及到许多不同超参数的设置。需要调试的重要超参数一般包括：学习率、momentum、mini-batch size、隐藏单元(hidden units)、层数、学习率衰减。一般对于你要解决的问题而言，你很难提前知道哪个参数…

编程日记2024/12/19 06:40:00

AD上删除了Exchange容器,再重装时报'找不到企业组织容器

AD上删除了Exchange容器,再重装时报找不到企业组织容器。安装日志如下:[06/16/2014 04:58:15.0054] [0] **********************************************[06/16/2014 04:58:15.0054] [0] Starting Microsoft Exchange Server 2013 Service Pack 1 Setup[06/16/2014 04:58:15.0…

编程日记2024/12/19 06:30:00

实战：基于OpenPose的卡通人物可视化 | CSDN博文精选

作者 | Wuzebiao2016来源 | CSDN博客前言去年打算用些现成的Pose做些展示，因为以前有在OpenPose做些识别等开发工作，所以这次我就简单在OpenPose上把骨架用动画填充上去，关于能够和人动作联系起来的动画，我找到了Unity提供的示例A…

编程日记2024/12/19 06:20:00

基于Idea从零搭建一个最简单的vue项目

一、需要了解的基本知识 node.js Node.js是一个Javascript运行环境(runtime)，发布于2009年5月，由Ryan Dahl开发，实质是对Chrome V8引擎进行了封装。Node.js对一些特殊用例进行优化，提供替代的API，使得V8在非浏览器环境…

编程日记2024/12/19 06:10:00

OpenCV中基于LBP算法的人脸检测测试代码

下面是OpenCV 3.3中基于CascadeClassifier类的LBP算法实现的人脸检测，从结果上看，不如其它开源库效果好，如libfacedetection，可参考 https://blog.csdn.net/fengbingchun/article/details/52964163 #include "funset.hpp&qu…

编程日记2024/12/19 06:00:00

解决getOutputStream() has already been called for this response[java io流]

getOutputStream() has already been called for this response以上异常出现的原因和解决方法：jsp中出现此错误一般都是在jsp中使用了输出流（如输出图片验证码，文件下载等），没有妥善处理好的原因。具体的原因&#xff…

编程日记2024/12/19 05:50:00

吴恩达老师深度学习视频课笔记：构建机器学习项目(机器学习策略)(1)

机器学习策略(machine learning strategy)：分析机器学习问题的方法。正交化(orthogonalization)：要让一个监督机器学习系统很好的工作，一般要确保四件事情，如下图：(1)、首先，你通常必须确保至少系统在训练集…

编程日记2024/12/19 05:40:00

内行的AI盛会——北京智源大会带你洞见未来！（含日程及限量优惠）

报名请点击「阅读原文」北京国家会议中心2019年10月31日-11月1日www.baai.ac.cn/2019使用优惠码「BAAICSDN」专享7折优惠学生票仅69元，数量有限，先到先得世界AI看中国，中国AI看北京（长按上图或点击「阅读原文」注册参会&#xff0…

编程日记2024/12/19 05:30:00

微软职位内部推荐-Sr. Dev Lead

微软近期Open的职位:JD如果你想试试这个职位，请跟我联系，我是微软的员工，可以做内部推荐。发你的中英文简历到我的邮箱：Nicholas.lu.mail(at)gmail.com转载于:https://www.cnblogs.com/DotNetNuke/p/3885283.html

编程日记2024/12/19 05:20:00

吴恩达老师深度学习视频课笔记：构建机器学习项目(机器学习策略)(2)

进行误差分析：可进行人工统计或可同时并行评估几个想法。进行误差分析时，你应该找一组错误例子，可能在你的开发集里或者在你的测试集里，观察错误标记的例子，看看假阳性(false positives)和假阴性(false negatives)&…

编程日记2024/12/19 05:10:00

3D机器人视觉在仓储物流和工业自动化领域的应用 | AI ProCon 2019

整理 | 夕颜出品 | AI科技大本营（ID:rgznai100）随着深度学习和机器学习的发展，机器人已经走出实验室，越来越多地地应用于各行各业，其中，仓储物流和工业化领域就有许多适合机器人作业的场景环境。人眼的一大…

编程日记2024/12/19 05:00:00

【转载】gdi+ 内存泄漏

【转载】http://issf.blog.163.com/blog/static/1941290822009111894413472/ 最近用GDI实现了几个自定义控件，但是发现存在内存泄露问题 BOOL CGdiplusBugDlg::OnEraseBkgnd(CDC* pDC) {Image* pImage Image::FromFile(L"E:\\bac.bmp");Graphics g(pDC-&…

编程日记2024/12/19 04:50:00

ubuntu fctix

感觉ubuntu自在大ibus输入法用起来实在是灰常蛋痛啊，于是乎就换了fcitx输入法（很多人推荐嘛）在安装之前先说一下fcitx输入法吧。1.添加fcitx源(官方的源是旧版,不推荐使用)fcitx的ppa源，内含fcitx和fcitx-config,使用命令sudo ged…

编程日记2024/12/19 04:40:00

深度学习中的优化简介

深度学习算法在许多情况下都涉及到优化。1. 学习和纯优化有什么不同在大多数机器学习问题中，我们关注某些性能度量P，其定义于测试集上并且可能是不可解的。因此，我们只是间接地优化P。我们系统通过降低代价函数J(θ)来提高P。这一点与纯优化不…

编程日记2024/12/19 04:30:00

飞凌OK6410开发板移植u-boot官方最新版u-boot-2012.10.tar.bz2

Part0 准备知识 0.1 关键参数说明 0.1.1 开发板说明 OK6410是飞凌公司发布的一款开发板，当前有2个版本，OK6410-A和OK6410-B，我当前使用的是前者；前者也经历过升级，所以有128M ram的和较新的256内存的版本，n…

编程日记2024/12/19 04:20:00

参数量110亿，附赠750GB数据集，Google提NLP预训练模型T5

整理 | Just，夕颜出品 | AI科技大本营（ID:rgznai100）近日，Google 在最新一篇共有 53 页的论文《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》中，提出了一个最新的预训练模型…

编程日记2024/12/19 04:10:00

Linux之bash编程基本语法

在Linux运维工作中，我们为了提高工作效率通常会用bash编写脚本来完成某工作。今天就来为大家介绍bash的一些常见的基本语法。在讲解bash语法之前首先介绍一下bash。bash环境主要是由解释器来完成的。【解释器】：解释命令：词法分析、语法分析、…

编程日记2024/12/19 04:00:00