跳到主要內容

萬里雲:GOOGLE 機器學習系統 TENSORFLOW LITE 離線辨識圖片效率大增

之前,臉書「垃圾文界的一位美少年」粉專上瘋傳一張辨識女星的驗證圖片,難倒一票夏于喬、宋芸樺傻傻分不清網友;隨後跑出一堆惡搞驗證圖,甚至還有辨識透抽的版本出現,讓參戰的網友們玩得不亦樂乎。

近期大家會發現,在 Google 填寫表單或臉書身份認證時,CAPTCHA 驗證方式變得越來越多元,文末將補充精彩的演進史。其中最常出現的就是以上的圖片辨識九宮格,要使用者指認出不同圖片中的物件,而這個功能其實就是TensorFlow 應用之一。
前年Google發佈了TensorFlow物件辨識API,讓開發者更容易在同一張圖片中辨識及定位多個不同物件。TensorFlow目前採開放架構設計,並開源提供開發者取用,希望能提升物件、人臉或影像品質等深度學習的速率與準確度。

上個月Google I/O 2017年會上,深度學習系統又進一步邁向了本次的重頭戲--輕量版的TensorFlow Lite。此版本在Android行動裝置上也能發揮人工智慧功能,藉由行動處理器進行裝置端的端點運算,甚至能夠支援離線操作。根據Google測試結果,在MobileNets系統運算下,離線準確率在70.7%~89.5%之間,雖然相比還是不及連上雲端的94%,但也已經十分出色,且在速度與方便性上更勝一籌。

TensorFlow發表近兩年來,已經幫助研究人員、醫療人員、工程師、藝術家、學生等各行各業增進工作效率,應用範圍包含更精確的機器翻譯、早期皮膚癌檢測、防止糖尿病的失明併發症等,族繁不及備載,如今已被用於超過六千個開源資料庫,未來應用的層面勢必更廣泛,深度學習將帶來的效益值得期待。
目前的機器深度學習技術其實不只有 Google TensorFlow,Facebook 去年推出的手機版新功能--創意效果相機,可偵測人臉及變換相片材質的互動式玩法,靠的也是他們專為手機設計的機器學習框架 Caffe2Go。而上個月蘋果 WWDC 2017 發表會上推出Core ML,開始在 iOS 11內導入裝置端的端點運算學習模型,試圖降低在 iOS裝置運行機器學習的困難度,期待iPhone、iPad等行動裝置在效能上能有更高效的表現。

CAPTCHA 小教室


CAPTCHA

Completely Automated Public Turing test to tell Computers and Humans Apart,俗稱驗證碼,是一種區分用戶是電腦或人的公共全自動程式。

reCAPTCHA

提供「有意義」的驗證碼讓使用者辨識,可能是 Google 地圖街景中的模糊文字、掃描古籍中的文字片段等等,這樣的驗證碼可以讓使用者在輸入的同時,幫助典籍或資料庫數位化建檔,也就是讓每一個用戶幫忙做數位校稿的工作。

No CAPTCHA reCAPTCHA

使用者只要在「我不是機器人」(I’m not a robot)的方框中打勾,就可以完成判別。新的API也在行動裝置上進行實驗,例如要求使用者選擇和範例圖片中物體相同的所有圖片。Google表示,在手機上點選簡單的動物圖片會比輸入一串枯燥扭曲的文字更為容易。

Invisible reCAPTCHA

無需用戶互動,利用演算法便可分辨人類和程式,詳情可以參考 Google reCAPTCHA 官方網頁。

參考資訊


CAPTCHA 又有新突破,Google 正準備「Invisible reCAPTCHA」
https://security.googleblog.com/2014/12/are-you-robot-introducing-no-captcha.html
Android O beta is available today
https://techcrunch.com/2017/05/17/android-o-beta-is-available-today/
Google釋出全新TensorFlow物件辨識API:不僅可在手機運作,甚至不用聯網
https://www.bnext.com.tw/article/44980/google-tensorflow-object-detection-api
Supercharge your Computer Vision models with the TensorFlow Object Detection API
https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html
Google 開源機器學習系統 TensorFlow 1.0 正式發表
https://technews.tw/2017/02/18/google-announcing-tensorflow-1-0/
Caffe2go:Facebook最新的深度學習框架
https://kknews.cc/zh-tw/tech/jvr3zmy.html

留言

這個網誌中的熱門文章

鑽石級贊助商 - KKBOX 帶你打造具備 NLP 功能的 Telegram Bot (上)

打造具備 NLP 功能的 Telegram Bot(上) 最近因為一些契機學了 Python 3,用它做了一個 Telegram Bot ( GitHub 連結 ),裡面用到 NLP Service,用上下兩篇文章記錄一下實作過程還有眉角。上篇首先教大家如何做一個最基本的回聲 Chatbot,接下來我們可以透過 NLP 服務,讓 Chatbot 根據使用者不同的訊息做回答,這樣就變成更加人性化的聊天機器人囉! 使用的工具及服務: Python 3 (for develop) pipenv (for dependency management) OLAMI (for NLP) ngrok (for testing) Step 1. Creating new bot Telegram 很有趣的地方在於,與其他通訊軟體(Line、Messenger)相比,開發者管理 Bot 的方式也是透過官方提供的一位 Bot 在處理的,它叫做 BotFather (眾 Bot 之父 XD)。如果已經有 Telegram 帳號,只要加 BotFather 為好友,就可以開始管理你的 Bot。 加入 BotFather 好友後,它會親切地問候,並告訴你他能為你提供什麼服務。 I can help you create and manage Telegram bots. If you're new to the Bot API, please see the manual ([https://core.telegram.org/bots](https://core.telegram.org/bots)). You can control me by sending these commands: /newbot - create a new bot /mybots - edit your bots [beta] /mygames - edit your games ([https://core.telegram.org/bots/games](https://core.telegram.org/bots/games)) [beta] Edit Bots /setname - change a bot's name /setdescr...

利用 Jitsi 建立個人化的視訊會議平台

  近期因為疫情的關係,越來越多企業開始實施分流或在家工作,視訊會議的需求也日益增加。 在商用解決方案選擇上,有不少企業會選擇知名品牌的產品,例如  Cisco Webex 、 Google Meet 、 Microsoft Teams 、 Zoom  都是很不錯的方案。 KKBOX 集團在去年便試行及做好充分 work from home 的準備,今年五月也因應疫情升溫,全員 work from home 至今兩個月有餘。 當然,取之 Open Source,也要對社群有些貢獻。在這一屆 COSCUP,我們要來介紹 Open Source 圈中也很知名,效果也很不錯的一套視訊會議平台: Jitsi 。 除了基本的視訊會議功能外,在最後我們也會示範如何透過 Jitsi 畫面輸出到 YouTube/Twitch 或其他支援 RTMP 的平台進行直播。 由於篇幅有限,且 Jitsi 可以調整的細節非常多。今天我們純粹很快速的示範,如何簡單的建置出一個 Jitsi 環境,並提供單場會議內容錄影或直播。 Jitsi 的文件可以在 這裡 找到。 今天透過 AWS Lightsail 的 $10/month instance(1 core CPU + 2GB RAM + 60GB SSD),作業系統則是 Ubuntu 20.04 來示範。當然,使用其他 VPS 亦可,大同小異,這邊直接跳過 VPS 相關的建置過程。 *firewall 相關資料參考 這裡 及 這裡 。 針對系統做必要的更新 基本的 apt repository 更新: $ sudo apt update 因為後面要示範的會議錄影及直播需要使用 ALSA loopback device,如果是 EC2 or Lightsail 則需要額外安裝 generic kernel( 註 ): $ sudo apt install linux-image-generic linux-headers-generic linux-image-extra- virtual 接著做系統套件們的更新: $ sudo apt dist-upgrade $ sudo apt autoremove 如果是 AWS EC2 or Lightsail 則需要另外再將預設的 AWS optimized kernel...

機器學習的五大實務問題:對企業的影響與相應的化解方式

Appier 首席機器學習科學家 林守德博士 正如 Jason Jennings 及 Laurence Haughton 在《以快吃慢–如何藉速度在商戰中克敵制勝》一書中指出──未來,不是大公司吃掉小公司,而是速度快的公司吃掉速度慢的公司。 從現在開始,唯有善用適當的資訊快速做出決策的企業,才能成為戰場上的贏家。 機器學習技術驅動了這場變革。無論企業是嘗試向顧客提出建議、改進生產製造流程或應對市場的變動,都能運用機器學習技術處理大量的資料,進而提高自身的競爭優勢。 然而,機器學習雖能創造大好機會,卻也同時帶來了相應的挑戰。機器學習系統需要大量的資料,以及執行複雜的運算能力。顧客期望改變、出乎意料的市場波動等等外部因素,都意味著機器學習模型的運作並不是百分之百的自動,往往仰賴許多外部的資源來作監控及維護。 此外,機器學習也有不少尚待解決的實務問題。以下將深入探討機器學習的五大實務問題,以及這些問題對企業應用會產生的影響。 1. 資料品質 機器學習系統仰賴資料進行訓練,而訓練資料在廣義上可分為「特徵」及「標籤」兩種類別。 「特徵」是輸入機器學習模型的資料,像是來自感測器、顧客問卷、網站 cookie 或歷史資訊等等。 然而這些特徵的品質可能良莠不齊。舉例而言,顧客在填寫問卷時可能會隨便填寫,或對題目略而不答;感測器可能因失靈而回傳錯誤資料;即使使用者的網頁行為明確,網站 cookie 回報的資訊也可能不完整。 此外,資料也可能包含雜訊,當無謂的資訊夾雜其中時,機器學習模型將會受到誤導而做出不正確的預測。 相較於「特徵」,「標籤」的正確性與穩定度更為重要。標籤是機器學習模型最後輸出的結果。所以需要在訓練的時間利用正確的結果教導機器學習模型。標籤的稀疏性也是個問題,這是當系統已掌握大量輸入的資料卻對輸出的結果沒有把握時出現的現象。在這樣的情況下,將難以針對該模型偵測其特徵與標籤之間的關聯性優化,甚至需要耗費額外的人力干預,將標籤與輸入資料關聯起來。 機器學習需仰賴輸入與輸出資料的關聯,才能具備足夠的泛化能力以預測未來行動並提供相關建議。因此,如果輸入資料過於雜亂、殘缺或有所偏差時,將可能難以理解某輸出/標籤的產出原因。近年來機器學習也開發出許多先進的方法如半指導式學習,轉移學習來處理這樣的問題。 2. 複雜性與品質的取捨 建立強大的機器學習模型需要大量的計算資源來處理特徵和...