跳到主要內容

萬里雲:GOOGLE 機器學習系統 TENSORFLOW LITE 離線辨識圖片效率大增

之前,臉書「垃圾文界的一位美少年」粉專上瘋傳一張辨識女星的驗證圖片,難倒一票夏于喬、宋芸樺傻傻分不清網友;隨後跑出一堆惡搞驗證圖,甚至還有辨識透抽的版本出現,讓參戰的網友們玩得不亦樂乎。

近期大家會發現,在 Google 填寫表單或臉書身份認證時,CAPTCHA 驗證方式變得越來越多元,文末將補充精彩的演進史。其中最常出現的就是以上的圖片辨識九宮格,要使用者指認出不同圖片中的物件,而這個功能其實就是TensorFlow 應用之一。
前年Google發佈了TensorFlow物件辨識API,讓開發者更容易在同一張圖片中辨識及定位多個不同物件。TensorFlow目前採開放架構設計,並開源提供開發者取用,希望能提升物件、人臉或影像品質等深度學習的速率與準確度。

上個月Google I/O 2017年會上,深度學習系統又進一步邁向了本次的重頭戲--輕量版的TensorFlow Lite。此版本在Android行動裝置上也能發揮人工智慧功能,藉由行動處理器進行裝置端的端點運算,甚至能夠支援離線操作。根據Google測試結果,在MobileNets系統運算下,離線準確率在70.7%~89.5%之間,雖然相比還是不及連上雲端的94%,但也已經十分出色,且在速度與方便性上更勝一籌。

TensorFlow發表近兩年來,已經幫助研究人員、醫療人員、工程師、藝術家、學生等各行各業增進工作效率,應用範圍包含更精確的機器翻譯、早期皮膚癌檢測、防止糖尿病的失明併發症等,族繁不及備載,如今已被用於超過六千個開源資料庫,未來應用的層面勢必更廣泛,深度學習將帶來的效益值得期待。
目前的機器深度學習技術其實不只有 Google TensorFlow,Facebook 去年推出的手機版新功能--創意效果相機,可偵測人臉及變換相片材質的互動式玩法,靠的也是他們專為手機設計的機器學習框架 Caffe2Go。而上個月蘋果 WWDC 2017 發表會上推出Core ML,開始在 iOS 11內導入裝置端的端點運算學習模型,試圖降低在 iOS裝置運行機器學習的困難度,期待iPhone、iPad等行動裝置在效能上能有更高效的表現。

CAPTCHA 小教室


CAPTCHA

Completely Automated Public Turing test to tell Computers and Humans Apart,俗稱驗證碼,是一種區分用戶是電腦或人的公共全自動程式。

reCAPTCHA

提供「有意義」的驗證碼讓使用者辨識,可能是 Google 地圖街景中的模糊文字、掃描古籍中的文字片段等等,這樣的驗證碼可以讓使用者在輸入的同時,幫助典籍或資料庫數位化建檔,也就是讓每一個用戶幫忙做數位校稿的工作。

No CAPTCHA reCAPTCHA

使用者只要在「我不是機器人」(I’m not a robot)的方框中打勾,就可以完成判別。新的API也在行動裝置上進行實驗,例如要求使用者選擇和範例圖片中物體相同的所有圖片。Google表示,在手機上點選簡單的動物圖片會比輸入一串枯燥扭曲的文字更為容易。

Invisible reCAPTCHA

無需用戶互動,利用演算法便可分辨人類和程式,詳情可以參考 Google reCAPTCHA 官方網頁。

參考資訊


CAPTCHA 又有新突破,Google 正準備「Invisible reCAPTCHA」
https://security.googleblog.com/2014/12/are-you-robot-introducing-no-captcha.html
Android O beta is available today
https://techcrunch.com/2017/05/17/android-o-beta-is-available-today/
Google釋出全新TensorFlow物件辨識API:不僅可在手機運作,甚至不用聯網
https://www.bnext.com.tw/article/44980/google-tensorflow-object-detection-api
Supercharge your Computer Vision models with the TensorFlow Object Detection API
https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html
Google 開源機器學習系統 TensorFlow 1.0 正式發表
https://technews.tw/2017/02/18/google-announcing-tensorflow-1-0/
Caffe2go:Facebook最新的深度學習框架
https://kknews.cc/zh-tw/tech/jvr3zmy.html

留言

這個網誌中的熱門文章

實戰 Vibe Coding:利用 Amazon Q Developer CLI 打造經典平台跳躍遊戲

本篇文章將介紹如何透過 Amazon Q Developer CLI 建構一款完整的 2D 平台跳躍遊戲,從初始生成、功能增強,到最終打造出具備多關卡、多樣互動元素的遊戲體驗。特別的是,過程中開發者並未撰寫任何一行程式碼,僅透過自然語言指令與 CLI 對話完成所有工作,實踐「Vibe Coding」( 氛圍編碼 )。 本文作者為 Haowen Huang, AWS Senior Developer Advocate. 擁有 20 年以上電信、互聯網以及雲端運算等行業架構設計、技術及創業管理等豐富經驗,曾任職於 Microsoft、Sun Microsystems 等企業,專注為遊戲、電商、媒體和廣告等企業客戶提供 AI/ML、數據分析和企業數字化轉型等解決方案諮詢服務。 引言 本篇文章 ( English Version ) 將介紹如何使用 Amazon Q Developer CLI ,以 無需撰寫任何程式碼 的方式,打造一款經典的 2D 平台跳躍遊戲。透過「Vibe Coding」( 氛圍編碼 ) 的開發流程,開發者可以藉由簡單的語言提示詞 (prompt),逐步完成從遊戲雛型、功能擴充到完整關卡設計的開發流程。 整體開發流程將分為三個步驟: 1. 生成遊戲雛型 2. 功能擴充強化與畫面調整 3. 導入參考架構建立完整遊戲 環境建置 使用者需先安裝並設定 Amazon Q Developer CLI 。對於 macOS 使用者,可透過下列步驟完成安裝: 下載並安裝 Amazon Q Developer CLI 登入 Builder ID 完成認證 開啟終端機控制與無障礙設定 執行 q doctor 指令檢查 Amazon Q Developer CLI 是否安裝成功: 遊戲開發方面,建議使用 Python 語言與 Pygame 套件,可透過下列指令完成安裝;Pygame 提供以下功能支援: 畫面與動畫渲染 音效播放 鍵盤與搖桿輸入控制 物理模擬與碰撞偵測 多種媒體格式支援(圖片與音效) $ q doctor $ pip install pygame 第一步驟:初步生成遊戲雛型 透過簡單的一句 prompt,Amazon Q Developer CLI 結合 Pyg...

Navicat 17:AI 驅動資料管理的未來

在快速變化的資料管理領域,Navicat 始終站在創新與效率的最前沿。作為領先的資料庫管理與開發解決方案提供商,Navicat 再次以其最新版本 Navicat 17.2 展現了其在業界的卓越實力,讓使用者在資料管理中更具競爭優勢。 Navicat 17 推出標誌著資料庫管理技術的一次重要飛躍。該版本引入了一系列人工智慧 (AI) 驅動的功能,旨在進一步簡化操作流程並提升工作效率。這些功能讓使用者能夠輕鬆處理複雜的資料分析,並實現更智能的商業決策。 Navicat Premium 一直以來都是資料庫管理的佼佼者,該工具支援多達九種資料庫,包括 MySQL、PostgreSQL、MongoDB、MariaDB、SQL Server、Oracle、SQLite、Redis,以及 Snowflake。這樣的綜合性設計不僅消除了多平台切換帶來的困擾,還極大化了使用者的工作效率。 為提供更高效的協作工具,Navicat 雲端功能 (Navicat Cloud) 進一步提升了團隊合作的靈活性。使用者可以在雲端實現即時協作,讓團隊成員無論身處何地,都能共同編輯與管理項目,從而實現更高效的工作流程。 自創立以來,Navicat 已累積超過 500 萬次下載,並擁有超過 18 萬名使用者,包括多家知名的 Fortune 500 公司,如 Apple、Google、JP Morgan 等。這些成就不僅體現出 Navicat 的產品實力,更說明其在業界的深厚信譽。 Navicat 始終秉持創新與使用者導向的理念,致力於為資料管理提供最可靠、高效的解決方案。未來,我們將持續推出更多令人興奮的新功能,幫助使用者應對不斷變化的商業需求。 現在就探索 Navicat 17.2,感受 AI 技術帶來的全新資料管理體驗吧!欲了解更多資訊,歡迎造訪我們的官方網站: https://www.navicat.com.tw

利用 Jitsi 建立個人化的視訊會議平台

  近期因為疫情的關係,越來越多企業開始實施分流或在家工作,視訊會議的需求也日益增加。 在商用解決方案選擇上,有不少企業會選擇知名品牌的產品,例如  Cisco Webex 、 Google Meet 、 Microsoft Teams 、 Zoom  都是很不錯的方案。 KKBOX 集團在去年便試行及做好充分 work from home 的準備,今年五月也因應疫情升溫,全員 work from home 至今兩個月有餘。 當然,取之 Open Source,也要對社群有些貢獻。在這一屆 COSCUP,我們要來介紹 Open Source 圈中也很知名,效果也很不錯的一套視訊會議平台: Jitsi 。 除了基本的視訊會議功能外,在最後我們也會示範如何透過 Jitsi 畫面輸出到 YouTube/Twitch 或其他支援 RTMP 的平台進行直播。 由於篇幅有限,且 Jitsi 可以調整的細節非常多。今天我們純粹很快速的示範,如何簡單的建置出一個 Jitsi 環境,並提供單場會議內容錄影或直播。 Jitsi 的文件可以在 這裡 找到。 今天透過 AWS Lightsail 的 $10/month instance(1 core CPU + 2GB RAM + 60GB SSD),作業系統則是 Ubuntu 20.04 來示範。當然,使用其他 VPS 亦可,大同小異,這邊直接跳過 VPS 相關的建置過程。 *firewall 相關資料參考 這裡 及 這裡 。 針對系統做必要的更新 基本的 apt repository 更新: $ sudo apt update 因為後面要示範的會議錄影及直播需要使用 ALSA loopback device,如果是 EC2 or Lightsail 則需要額外安裝 generic kernel( 註 ): $ sudo apt install linux-image-generic linux-headers-generic linux-image-extra- virtual 接著做系統套件們的更新: $ sudo apt dist-upgrade $ sudo apt autoremove 如果是 AWS EC2 or Lightsail 則需要另外再將預設的 AWS optimized kernel...