跳到主要內容

萬里雲:GOOGLE 機器學習系統 TENSORFLOW LITE 離線辨識圖片效率大增

之前,臉書「垃圾文界的一位美少年」粉專上瘋傳一張辨識女星的驗證圖片,難倒一票夏于喬、宋芸樺傻傻分不清網友;隨後跑出一堆惡搞驗證圖,甚至還有辨識透抽的版本出現,讓參戰的網友們玩得不亦樂乎。

近期大家會發現,在 Google 填寫表單或臉書身份認證時,CAPTCHA 驗證方式變得越來越多元,文末將補充精彩的演進史。其中最常出現的就是以上的圖片辨識九宮格,要使用者指認出不同圖片中的物件,而這個功能其實就是TensorFlow 應用之一。
前年Google發佈了TensorFlow物件辨識API,讓開發者更容易在同一張圖片中辨識及定位多個不同物件。TensorFlow目前採開放架構設計,並開源提供開發者取用,希望能提升物件、人臉或影像品質等深度學習的速率與準確度。

上個月Google I/O 2017年會上,深度學習系統又進一步邁向了本次的重頭戲--輕量版的TensorFlow Lite。此版本在Android行動裝置上也能發揮人工智慧功能,藉由行動處理器進行裝置端的端點運算,甚至能夠支援離線操作。根據Google測試結果,在MobileNets系統運算下,離線準確率在70.7%~89.5%之間,雖然相比還是不及連上雲端的94%,但也已經十分出色,且在速度與方便性上更勝一籌。

TensorFlow發表近兩年來,已經幫助研究人員、醫療人員、工程師、藝術家、學生等各行各業增進工作效率,應用範圍包含更精確的機器翻譯、早期皮膚癌檢測、防止糖尿病的失明併發症等,族繁不及備載,如今已被用於超過六千個開源資料庫,未來應用的層面勢必更廣泛,深度學習將帶來的效益值得期待。
目前的機器深度學習技術其實不只有 Google TensorFlow,Facebook 去年推出的手機版新功能--創意效果相機,可偵測人臉及變換相片材質的互動式玩法,靠的也是他們專為手機設計的機器學習框架 Caffe2Go。而上個月蘋果 WWDC 2017 發表會上推出Core ML,開始在 iOS 11內導入裝置端的端點運算學習模型,試圖降低在 iOS裝置運行機器學習的困難度,期待iPhone、iPad等行動裝置在效能上能有更高效的表現。

CAPTCHA 小教室


CAPTCHA

Completely Automated Public Turing test to tell Computers and Humans Apart,俗稱驗證碼,是一種區分用戶是電腦或人的公共全自動程式。

reCAPTCHA

提供「有意義」的驗證碼讓使用者辨識,可能是 Google 地圖街景中的模糊文字、掃描古籍中的文字片段等等,這樣的驗證碼可以讓使用者在輸入的同時,幫助典籍或資料庫數位化建檔,也就是讓每一個用戶幫忙做數位校稿的工作。

No CAPTCHA reCAPTCHA

使用者只要在「我不是機器人」(I’m not a robot)的方框中打勾,就可以完成判別。新的API也在行動裝置上進行實驗,例如要求使用者選擇和範例圖片中物體相同的所有圖片。Google表示,在手機上點選簡單的動物圖片會比輸入一串枯燥扭曲的文字更為容易。

Invisible reCAPTCHA

無需用戶互動,利用演算法便可分辨人類和程式,詳情可以參考 Google reCAPTCHA 官方網頁。

參考資訊


CAPTCHA 又有新突破,Google 正準備「Invisible reCAPTCHA」
https://security.googleblog.com/2014/12/are-you-robot-introducing-no-captcha.html
Android O beta is available today
https://techcrunch.com/2017/05/17/android-o-beta-is-available-today/
Google釋出全新TensorFlow物件辨識API:不僅可在手機運作,甚至不用聯網
https://www.bnext.com.tw/article/44980/google-tensorflow-object-detection-api
Supercharge your Computer Vision models with the TensorFlow Object Detection API
https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html
Google 開源機器學習系統 TensorFlow 1.0 正式發表
https://technews.tw/2017/02/18/google-announcing-tensorflow-1-0/
Caffe2go:Facebook最新的深度學習框架
https://kknews.cc/zh-tw/tech/jvr3zmy.html

留言

這個網誌中的熱門文章

實戰 Vibe Coding:利用 Amazon Q Developer CLI 打造經典平台跳躍遊戲

本篇文章將介紹如何透過 Amazon Q Developer CLI 建構一款完整的 2D 平台跳躍遊戲,從初始生成、功能增強,到最終打造出具備多關卡、多樣互動元素的遊戲體驗。特別的是,過程中開發者並未撰寫任何一行程式碼,僅透過自然語言指令與 CLI 對話完成所有工作,實踐「Vibe Coding」( 氛圍編碼 )。 本文作者為 Haowen Huang, AWS Senior Developer Advocate. 擁有 20 年以上電信、互聯網以及雲端運算等行業架構設計、技術及創業管理等豐富經驗,曾任職於 Microsoft、Sun Microsystems 等企業,專注為遊戲、電商、媒體和廣告等企業客戶提供 AI/ML、數據分析和企業數字化轉型等解決方案諮詢服務。 引言 本篇文章 ( English Version ) 將介紹如何使用 Amazon Q Developer CLI ,以 無需撰寫任何程式碼 的方式,打造一款經典的 2D 平台跳躍遊戲。透過「Vibe Coding」( 氛圍編碼 ) 的開發流程,開發者可以藉由簡單的語言提示詞 (prompt),逐步完成從遊戲雛型、功能擴充到完整關卡設計的開發流程。 整體開發流程將分為三個步驟: 1. 生成遊戲雛型 2. 功能擴充強化與畫面調整 3. 導入參考架構建立完整遊戲 環境建置 使用者需先安裝並設定 Amazon Q Developer CLI 。對於 macOS 使用者,可透過下列步驟完成安裝: 下載並安裝 Amazon Q Developer CLI 登入 Builder ID 完成認證 開啟終端機控制與無障礙設定 執行 q doctor 指令檢查 Amazon Q Developer CLI 是否安裝成功: 遊戲開發方面,建議使用 Python 語言與 Pygame 套件,可透過下列指令完成安裝;Pygame 提供以下功能支援: 畫面與動畫渲染 音效播放 鍵盤與搖桿輸入控制 物理模擬與碰撞偵測 多種媒體格式支援(圖片與音效) $ q doctor $ pip install pygame 第一步驟:初步生成遊戲雛型 透過簡單的一句 prompt,Amazon Q Developer CLI 結合 Pyg...

Kronos 如何做到世界級的成績

  由資深華爾街投資人領軍於 2018 年成立,Kronos Research 結合人工智慧、機器學習、高速網路等先進技術,透過進階的資料分析開發出獨家的量化交易預測模型,並使用全自動的交易策略自營,同時作為加密貨幣造市商,提供全球加密貨幣商品的即時報價。至今四年的時間,便擠身全球前五大的加密貨幣量交易團隊,創下 2021 年每日平均交易額 50 億美金,單日最高交易額 230 億美金的記錄。 人才和技術是 Kronos 最重要的兩大要素,團隊採開放式合作、解決問題導向、美式工作風格,Kronos 期許任何職位的夥伴,都能信任彼此、安心發問、共同快速解決問題。主管的管理策略,不同於傳統上對下的管理,而是以幫助者的角色,解決不同的需求,放大每個職位的生產力。我們希望這個產業在台灣能夠茁壯,讓台灣的技術人才知道有這個國際舞台可以發揮。 一窺量化交易技術及團隊 高頻交易跟一般大家熟知的交易最大的差距在於自動化。我們熟知的交易模式多半透過人工,由交易員綜合市場資訊後向交易所下單;高頻交易則是由程式自動判斷市場資訊並且下單。高頻交易多半關注短時間的市場波動,在收到市場報價後,在極短時間透過預先訓練的統計模型做出買賣決策。在高額報酬的背後,結合了不同專業:包括資料科學、統計與機器學習、底層系統優化、以及分散式系統。 高頻交易的流程,從 Market Data Parser 作為源頭持續搜集來自交易所的歷史資料,交由 Alpha Modeling 訓練出可預測未來短時間市場變動的模型。接著交易團隊撰寫策略程式,並依據策略需要套用選擇合適的 Alpha 模型,由極低延遲的交易程式向交易所下單。以下是各模塊的介紹: Market Data Parser(Data Team):高頻交易是一個資料驅動的行業,全面且高正確率的資料對於後續訓練很重要。Kronos Research 在全球十多個機房內有數百台服務器,每天 24 小時不間斷錄製來自交易所的報價單。面對每天 10TB+ 的巨量資料,data team 大量使用雲端分散技術以及自動化技術確保資料流的穩定。 Alpha Modeling(Alpha Team):在投資市場中,Alpha 代表著高於大盤的超額收益,Alpha Model 則代表預測將來市場的數學模型。Alpha Team 透過統計以及機器學習,以敏銳的邏輯跟觀...

你所不知道的 foodpanda

  2020 左右,隨著新冠疫情流行,台灣也逐漸流行起一股懶人旋風。懶懶躺在沙發上,動動手指滑滑螢幕,生鮮或美食就能快速又安全地由可愛的粉紅色熊貓外送員送達您門口。多數人知道 foodpanda 是台灣最大生鮮美食外送平台,也不少人知道 foodpanda 在台灣不斷擴張業務範圍,但 foodpanda 也有許多台灣科技圈所不知道的事。 例如,foodpanda 其實並非台灣本土廠商,也非只專注在亞洲區域。foodpanda 隸屬於德國 Delivery Hero 集團,業務橫跨歐洲、亞洲、美洲及北非,旗下更有十多個生鮮美食外送品牌。除此之外,foodpanda 於 2021 年時也在台灣正式成立全球第三個 Tech Hub。做為四大產品 RD 研發中心之一,台灣與德國柏林、新加坡及土耳其伊斯坦堡的人才緊密地合作,專注於打造 end-to-end 的顧客體驗。諸如月費方案 Panda Pro、外帶自取、餐廳內用 (目前仍未在台灣上市) 等功能。期待能持續吸收優秀人才、與其它三個跨國研發中心合作,打造後疫情時代新的成長引擎。 事實上,台灣的 foodpanda 研發團隊並不僅止於打造台灣本土產品。反之,我們所建立的平台及產品,已成功於近 20 個國家、10 個品牌上市。要在快速的步調下,打造持續進步且符合不同國家文化客戶需求的產品,我們依靠的是 專案團隊成員一條龍組合 從 Product Manager、Engineering Manager、iOS/Android/Web/Backend developer、QA、Product Designer、Product Analyst 全都在同一個 product line squad。讓相同產品的團隊成員能緊密合作、第一手快速了解市場、滿足需求。 國際專業團隊緊密合作 foodpanda 的 iOS/Android/Web/Backend 等專業工程師,都各自設有其跨 squad 的 chapter 組織。讓工程師能在專案團隊以外,有跨國跨團隊專業能力交流的機會。在 chapter 中,相同技術域領的專家們,會一起制定共同的實作標準、分享在專案中遇到類似的挑戰,並且找出可能的應對方案。因此,在 foodpanda 我們不只打產品專案團隊的速度戰、還打整個集團的整合能力團體戰,讓德國、新加坡、台灣、伊斯坦堡的工程師...