如今随着人工智能深度学习的持续火热,计算机视觉领域也发生了翻天覆地的变化,而场景文字检测与识别作为其重要的研究课题之一,自然也不可避免被这股新科技浪潮所席卷。
其实场景文字这问题早在15-20年前就已经被关注并研究,与传统的文本文字检测相比,其重要区别在于需要将照片或者视频中的文字准确识别出来。
通常这个过程可以大致被理解为两个步骤,首先需要对照片中存在文字的区域进行定位,也就是找到单词或者文本的边界框;第二步才是对定位到的文字进行精准识别。
总体来看,场景文字检测的发展历程与很多计算机视觉方面的探究任务相类似,起初都是基于传统的手工设计特征,但这一点在2014年左右发生了本质变化,主要是人工智能深度学习方法的出现打破了之前的藩篱。
但不容忽视的一点是,尽管强大的深度学习为该领域带来了十足的推动力,但目前的场景文字识别与检测还面临数不清的挑战。
例如,以文字颜色、大小、方向、字体等多变维度主导的场景文字多样性为自然条件下的文字识别与检测带来了不小困难。日常生活中随处可见的信号灯、指示标、栅栏、花草等局部与文字有一定相似性,这也为文字检测与识别过程带来很大干扰,等等。
发展至今,深度学习在不规则排列的文字检测与识别方面仍然表现非常棘手,模型的泛化能力有限……以上统统都会成为深度学习亟需突破的障碍!
没想到发展正旺的深度学习竟然有这么多坑坑洼洼,但开发者小伙伴们又对其如此“执念”,肿么办呢?别急,福利说到就到!
1月17日,由华为开发者联盟(华为终端开放平台https://developer.huawei.com/consumer/cn/)举办的HUAWEI Developer Day系列沙龙活动19年第一站武汉站,有确切消息称华中科技大学教授白翔将应邀亮相沙龙现场。
与会的开发者们不单能亲眼看到久负盛名的技术大牛,还将全面了解最先进的深度学习方法,用于自然场景图像中的文本识别与检测,并评估其准确性与稳定性等系列干货。
另外,白翔教授还会就如何将深度学习方法有效地应用于从二维视角中检索和识别具有任意形状的拉丁文和非拉丁文,并结合成功的场景文本阅读应用分析以及潜在研究方向做出预测等方面进行深入探讨,如此有料的学习内容,还等什么?
当然,除了涉及深度学习技术的透彻交流之外,本次武汉站沙龙活动,华为开发者联盟还携以下干货亮点来袭,都有哪些闪亮之处需要画圈圈呢?
深挖“时髦”的AI、AR/VR能力,打造酷炫应用不再难!关于诸多前沿技术,华为的多位高级架构师将在本次活动中,通过成功并详尽的应用案例,为到场的开发者深入讲述AI、AR/VR、快应用等最新技术,帮助开发者们理解与应用,完成打造酷炫应用的终极目标。
全面解读创新生态,智慧分发、直达所需不是梦!
关于如何通过华为快服务平台的智慧分发技术手段获取更多流量,并同时在竞争激烈的市场中成功探索流量新风口?对于这个开发者们普遍get的问题,现场华为高级产品经理将从全方位、多角度解读终端新生态服务体系,帮助开发者提高推广效率,提供更便捷、更优化的体验,惠及开发者,一个都不能少!
P20+荣耀手环,豪华大礼惊喜怎能间断?每位报名成功并且是前300位到现场开发者都会获得一份精美的伴手礼,同时还可现场体验AI、AR、快应用等创新业务。令人欣喜的是,议题间隙还会抽取华为P20、荣耀手环等豪华大礼!
HUAWEI Developer Day系列沙龙活动作为一个与广大开发者深度交流的平台,自上线以来,主要通过主题讨论、热门技术解读、行业大咖案例分享等多重形式,围绕最新技术和产品形态,将华为的最新开放能力及服务赋能给互联网开发者,同时还将最新行业动向及趋势传传递给最需要的人。
不论是资深开发者,抑或是开发新手,哪怕是对终端推广新形态感兴趣的运营经理……统统都可以参与其中,提升能力、受益颇多。
武汉站近在眼前!
这里有深度学习大牛的前沿技术分享;
这里有航班管家设计总监带来的精彩应用;
这里有华为最新的创新生态解读;
这里有炫酷时髦而又可行的技术……
面对如此一场充满楚风情结的AI技术的饕餮盛宴,你怎能不心动?
所以心动总不如行动!
从即日起到1月16日15:00,本场HUAWEI Developer Day武汉站沙龙的报名通道将持续畅通,并于1月17日正式在武汉上线启动。
想参加?很简单,直接登陆华为开发者联盟官网,或者及时戳一戳下方链接就能妥妥进入报名通道啦!
报名链接:https://huiyi.csdn.net/activity/product/goods_list?project_id=4084