跳到主要內容

萬里雲:GOOGLE 機器學習系統 TENSORFLOW LITE 離線辨識圖片效率大增

之前,臉書「垃圾文界的一位美少年」粉專上瘋傳一張辨識女星的驗證圖片,難倒一票夏于喬、宋芸樺傻傻分不清網友;隨後跑出一堆惡搞驗證圖,甚至還有辨識透抽的版本出現,讓參戰的網友們玩得不亦樂乎。

近期大家會發現,在 Google 填寫表單或臉書身份認證時,CAPTCHA 驗證方式變得越來越多元,文末將補充精彩的演進史。其中最常出現的就是以上的圖片辨識九宮格,要使用者指認出不同圖片中的物件,而這個功能其實就是TensorFlow 應用之一。
前年Google發佈了TensorFlow物件辨識API,讓開發者更容易在同一張圖片中辨識及定位多個不同物件。TensorFlow目前採開放架構設計,並開源提供開發者取用,希望能提升物件、人臉或影像品質等深度學習的速率與準確度。

上個月Google I/O 2017年會上,深度學習系統又進一步邁向了本次的重頭戲--輕量版的TensorFlow Lite。此版本在Android行動裝置上也能發揮人工智慧功能,藉由行動處理器進行裝置端的端點運算,甚至能夠支援離線操作。根據Google測試結果,在MobileNets系統運算下,離線準確率在70.7%~89.5%之間,雖然相比還是不及連上雲端的94%,但也已經十分出色,且在速度與方便性上更勝一籌。

TensorFlow發表近兩年來,已經幫助研究人員、醫療人員、工程師、藝術家、學生等各行各業增進工作效率,應用範圍包含更精確的機器翻譯、早期皮膚癌檢測、防止糖尿病的失明併發症等,族繁不及備載,如今已被用於超過六千個開源資料庫,未來應用的層面勢必更廣泛,深度學習將帶來的效益值得期待。
目前的機器深度學習技術其實不只有 Google TensorFlow,Facebook 去年推出的手機版新功能--創意效果相機,可偵測人臉及變換相片材質的互動式玩法,靠的也是他們專為手機設計的機器學習框架 Caffe2Go。而上個月蘋果 WWDC 2017 發表會上推出Core ML,開始在 iOS 11內導入裝置端的端點運算學習模型,試圖降低在 iOS裝置運行機器學習的困難度,期待iPhone、iPad等行動裝置在效能上能有更高效的表現。

CAPTCHA 小教室


CAPTCHA

Completely Automated Public Turing test to tell Computers and Humans Apart,俗稱驗證碼,是一種區分用戶是電腦或人的公共全自動程式。

reCAPTCHA

提供「有意義」的驗證碼讓使用者辨識,可能是 Google 地圖街景中的模糊文字、掃描古籍中的文字片段等等,這樣的驗證碼可以讓使用者在輸入的同時,幫助典籍或資料庫數位化建檔,也就是讓每一個用戶幫忙做數位校稿的工作。

No CAPTCHA reCAPTCHA

使用者只要在「我不是機器人」(I’m not a robot)的方框中打勾,就可以完成判別。新的API也在行動裝置上進行實驗,例如要求使用者選擇和範例圖片中物體相同的所有圖片。Google表示,在手機上點選簡單的動物圖片會比輸入一串枯燥扭曲的文字更為容易。

Invisible reCAPTCHA

無需用戶互動,利用演算法便可分辨人類和程式,詳情可以參考 Google reCAPTCHA 官方網頁。

參考資訊


CAPTCHA 又有新突破,Google 正準備「Invisible reCAPTCHA」
https://security.googleblog.com/2014/12/are-you-robot-introducing-no-captcha.html
Android O beta is available today
https://techcrunch.com/2017/05/17/android-o-beta-is-available-today/
Google釋出全新TensorFlow物件辨識API:不僅可在手機運作,甚至不用聯網
https://www.bnext.com.tw/article/44980/google-tensorflow-object-detection-api
Supercharge your Computer Vision models with the TensorFlow Object Detection API
https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html
Google 開源機器學習系統 TensorFlow 1.0 正式發表
https://technews.tw/2017/02/18/google-announcing-tensorflow-1-0/
Caffe2go:Facebook最新的深度學習框架
https://kknews.cc/zh-tw/tech/jvr3zmy.html

留言

這個網誌中的熱門文章

鑽石級贊助商 - KKBOX 帶你打造具備 NLP 功能的 Telegram Bot (上)

打造具備 NLP 功能的 Telegram Bot(上) 最近因為一些契機學了 Python 3,用它做了一個 Telegram Bot ( GitHub 連結 ),裡面用到 NLP Service,用上下兩篇文章記錄一下實作過程還有眉角。上篇首先教大家如何做一個最基本的回聲 Chatbot,接下來我們可以透過 NLP 服務,讓 Chatbot 根據使用者不同的訊息做回答,這樣就變成更加人性化的聊天機器人囉! 使用的工具及服務: Python 3 (for develop) pipenv (for dependency management) OLAMI (for NLP) ngrok (for testing) Step 1. Creating new bot Telegram 很有趣的地方在於,與其他通訊軟體(Line、Messenger)相比,開發者管理 Bot 的方式也是透過官方提供的一位 Bot 在處理的,它叫做 BotFather (眾 Bot 之父 XD)。如果已經有 Telegram 帳號,只要加 BotFather 為好友,就可以開始管理你的 Bot。 加入 BotFather 好友後,它會親切地問候,並告訴你他能為你提供什麼服務。 I can help you create and manage Telegram bots. If you're new to the Bot API, please see the manual ([https://core.telegram.org/bots](https://core.telegram.org/bots)). You can control me by sending these commands: /newbot - create a new bot /mybots - edit your bots [beta] /mygames - edit your games ([https://core.telegram.org/bots/games](https://core.telegram.org/bots/games)) [beta] Edit Bots /setname - change a bot's name /setdescr...

你的程式碼,你的硬體,你的 AI。掌握你的晶片未來。Your code, your hardware, your AI. Own your silicon future.

在 Tenstorrent,我們從晶片設計的最底層開始打造一切。我們不只採用 RISC-V,更將我們的擴充指令集規格全數公開。指令集架構 (ISA) 與硬體架構也完全開源。整個軟體堆疊,從韌體 (firmware)、運算核心 (compute kernels) 到編譯器,全都放在 GitHub 上,並採用你真正能用的授權條款 (Apache 2.0 / GPL)。我們的下一代晶片 Blackhole,旨在掃除傳統設計的低效率,讓你直接掌控資料流 (dataflow),實現更高的速度與電源效率。 Blackhole p150 (單晶片,次世代架構): 32G 記憶體,512GB/s 頻寬 387 TFLOPS (BFP8) / 774 TFLOPS (FP8) 大規模可程式化 RISC-V 核心陣列 算子函式庫、編譯器,整個軟體堆疊 — 全部開源 (OSS) 以原生 CCL 達成真正的多卡擴充,拒絕使用 PCIe workaround $1399 Wormhole n300 (雙晶片,經市場驗證的成熟架構): 24G 記憶體,576GB/s 頻寬 262 TFLOPS (BFP8) / 466 TFLOPS (FP8) 大規模可程式化 RISC-V 核心陣列 算子函式庫、編譯器,整個軟體堆疊 — 全部開源 (OSS) 以原生 CCL 達成真正的多卡擴充,拒絕使用 PCIe 土炮 $1499 現已上市。 立即在官網購買運算卡,或在我們的雲端平台上體驗。 如果你受夠了嚴苛的 EULA (使用者授權合約) 或處處受限的記憶體;又或者,你一直想親自動手,深入探索驅動你類神經網路的 C++ 程式碼;甚至想挑戰組合語言,親眼見證它...

COSCUP 2025 Call for Proposals / 徵稿辦法

COSCUP 常規徵稿已於 2025-05-10 截止,接下來進入加碼徵稿階段。加碼徵稿是為了提升大會的稿件品質,依據投稿狀況(數量、品質)部分徵稿主題可能提前喊停。最遲請於 05 月 24 日(AoE) 前投稿,徵稿主題可參考下方列表。 The regular call for proposals (CFP) for COSCUP closed on May 10, 2025. We are now entering the bonus CFP phase to improve the quality of submissions. Some topics may close earlier than expected, depending on the current status of submissions (in terms of quantity and quality). Please submit by May 24 (AoE) at the latest. You may refer to the topic list below for inspiration. 開始投稿 Submit Your Proposal 提案須知 Things you may need to know 演講形式:預設為現場30分鐘演講包含QA,若有其他需求可於提案系統註明,由各主題主辦單位決定如何安排。 Talk Format : The default format is a 30-minute on-site talk, including Q&A. If you have other requirements, please indicate them while submitting your proposal. The final arrangement will be decided independently by the organizers of each topic. 語言:COSCUP 受眾包含海內外與會者,大會不限制發表語言但鼓勵以英語發表。大會將公布雙語議程表,請提供中英文版議程介紹。 L...