機器學習去中心化
㈠ 被譽為機器學習之父的人是誰
被譽為機器學習之父的人是邁克爾·喬丹。
邁克爾·喬丹,喬丹教授目前執教於加州大學伯克利分校,還是美國科學院、美國工程院、美國藝術與科學院三院院士,是人工智慧領域唯一一位獲此成就的科學家。他被公認是機器學習領域開創者之一。
在全球移動互聯網大會上,Facebook人工智慧團隊首席AI科學Yann LeCun(楊立昆),加州大學伯克利分校Michael I. Jordan(邁克爾·喬丹)以及創新工場董事長兼首席執行官李開復對人工智慧的現在和未來展開了討論。
2017年5月27日,喬丹簽約螞蟻金服,在當天舉辦的螞蟻技術日上,人工智慧領域的世界級泰斗邁克爾·歐文·喬丹(Michael I.Jordan)從螞蟻金服CEO井賢棟手中接過聘書,正式成為螞蟻金服新成立的科學智囊團主席。
(1)機器學習去中心化擴展閱讀:
Michael I.Jordan他的學生桃李滿天下,比如深度學習領域權威Yoshua Bengio,貝葉斯學習領域權威Zoubin Ghahramani,以及前網路首席科學家吳恩達。
Michael I.Jordan於2018年9月22-23日親臨由Boolan在上海世紀皇冠假日酒店主辦的ML-Summit 2018全球機器學習技術大會現場。Michael I. Jordan的《機器學習前沿發展》的主題演講,深入闡述機器學習領域最新的前沿發展情況及其領導的機器學習團隊的最新研究成果。
㈡ 未來雲數據中心要怎樣的網路虛擬化解決方案機器學習與數據挖掘
每次談起虛擬化或雲計算,管理員都會不約而同的抱怨:"數據中心網路趕不上雲計算發展的步伐"。數據中心計算和存儲能力在過去十年裡取得了巨大提
升,而網路還在採用過去的架構方式,並沒有跟上這種演進步伐。隨著雲計算和移動互聯網的加速發展,企業對大幅提高數據中心能力的需求也越來越強烈。"
為什麼我們需要網路虛擬化
傳統的三層體系結構正在大數據和雲計算的新世界之下崩潰,大二層技術逐漸流行。數據中心內的硬體設備被虛擬化後,可以進一步地邏輯池化,並且邏輯資源池
可以跨多個數據中心,在邏輯資源池上提供虛擬的數據中心給用戶使用,從而將離散、分層、異構的多個數據中心聯結成新的雲數據中心。從這個角度來看,網路的
虛擬化變得絕對必要,以提供一種彈性和可擴展的工作負載的引擎,而不是單獨管理離散的物理元件之間的連接。
從本質上講,網路虛擬化是伺服器虛擬化自然的和必要的進化。它允許整個數據中心作為一個類似於計算和存儲資源一樣進行管理,能夠滿足動態應用程序工作的負載需求。
什麼樣的網路虛擬化才是適合於未來的雲計算數據中心?
sdn的提出,提供了另外一種方式來解決問題的可能。然而sdn只解決了其中一部分問題,並沒有解決現網存在的所有問題:
問題1:功能靈活擴展:要實現網路功能的軟體定義,從設備基礎架構就要靈活可編程,而功能靈活擴展需要一個開放和靈活擴展的controller平台架構。
問題2:平滑演進:任何客戶,不可能完全拋棄現有網路,去建一個新的網路。下一代網路必須能夠在現網直接部署,平滑過渡,才可以生存下去。這就要求controller必須具備開放的南北向介面,以便適應於傳統的網路。
對於未來的雲計算數據中心,網路虛擬化方案需要適應計算和存儲虛擬化的浪潮,快速的實現雲計算業務的發放,以及能夠滿足動態的應用程序工作負載的需求;同時需要幫助管理員更簡單的管理物理網路和虛擬網路,實現網路可視化。
開放性同樣是完美網路虛擬化的一個衡量標准,只有提供豐富的南北向介面和開放的api,並能夠滿足業界主流雲平台對接需求,才能夠滿足雲計算業務日新月異的發展,同時開放性也意味著能夠開發不同的插件以便適配現有的網路,從而實現網路的平滑演進。
華為agilecontroller如何打造面向未來的網路虛擬化解決方案
敏捷網路是華為公司面向企業市場發布的下一代網路解決方案。它基於sdn思想加三大架構創新,讓網路能夠快速、靈活地為業務服務,讓企業獲得領先四倍的業務創新速度,幫助企業在激烈的競爭中獲得先機。
敏捷網路控制器agilecontroller,智慧的數據中心大腦
華為敏捷控制器(agilecontroller),旨在為客戶構築簡單、高效、開放的雲數據中心網路,雲網融合,支撐企業雲業務快速發展,讓數據中心網路更敏捷地為雲業務服務。
第一:業務高效,實現自動地網路資源快速發放
在雲計算中,存儲和虛擬機已經自動化的實現了按需申請,華為agilecontroller能夠實現網路自願的自動化發放,申請網路資源像申請虛擬機一樣方便,高效的網路自動化從而讓雲計算業務更快上線,大大減小了業務上線的周期。
第二:運維簡單,讓虛擬與物理網路協同管控
華為agilecontroller能夠實現物理網路和虛擬網路的協同管控,支持物理資源和虛擬資源(物理網路、虛擬機、虛擬交換機、分布式虛擬交換機等)統一管理;通過網路可視化讓管理更簡單,極大的降低了管理員的管理難度。
在數據中心網路中,還有一個重要問題就是虛擬機遷移問題,agilecontroller能夠實現網路策略自動適應高速遷移,與業界其他虛擬機網路策略
遷移方案不同的是:agilecontroller通過高速radius介面下發網路策略,使得網路策略部署速度大幅提升,達到業界10-20倍,可滿足
數據中心海量虛擬機的突發遷移需求;結合華為豐富的大二層網路解決方案(trill/evn等),vmware虛擬機可以在數據中心內以及跨數據中心間任
意遷移,雲業務部署更加靈活。
第三:開放,可與主流雲平台對接
敏捷網路是從硬體定義網路,到軟體定義網路,再到全可
編程的系統。華為agilecontroller提供豐富的南北向介面,開放api,實現轉發面與控制面的可編程,可與客戶現有設備與業務系統進行對接,
提升端到端運維效率,加快新業務上線速度,營造企業快速創新環境。
業界雲平台眾多,主流雲平台有
huaweifusionsphere、vmwarevcac、openstack等等,華為agilecontroller均支持與其對接,致力於打造
一個彈性、開放平台,集成各個領域的優秀實踐,讓用戶可根據業務需要靈活定義網路,做到即需即用。
我們毫不懷疑,數據中心的發展勢頭迅
猛。基礎架構如何支持這種增長呢?虛擬化僅僅是其中的一部分。未來網路可能還需要更多的特徵。在諸多的特徵中,如何選擇構建自己的網路呢?目前來看,華為
的敏捷網路,即吸取了sdn的精華,同時又考慮了現有網路的平滑演進,agilecontroller的簡單、高效和開放,為成功構建未來的網路奠定了堅
實的基礎。
雲計算讓網路應用變得精彩,讓應用創新變得更容易;網路是雲計算的基石,沒有網路就沒有雲計算,雲計算的發展對網路提出了更高的要求。
敏捷控制器agilecontroller應運而生,它的出現簡化了客戶的雲平台對設備的操作難度,現在有了敏捷控制器agilecontroller
之後,全自動的中間件可以協助用戶對設備進行管理。同時華為敏捷控制器是一個開放的平台,將把敏捷控制器的南北向介面開放,從而給行業客戶一個開放的自定
義空間,與合作夥伴一起構建起敏捷商業的實踐,讓他們更聚集在業務的變革和轉型上,也讓ict的雲端融合管理真正實現,大幅度提升了雲計算的部署和管理效
率,讓物理網路和計算存儲資源一樣,成為雲的一部分,網路和計算相互協同,相互可視,讓雲計算變得簡單。
㈢ 機器學習的分類
目前機器學習主流分為:監督學習,無監督學習,強化學習。
監督學習:
監督學習可分為「回歸」和「分類」問題。
在回歸問題中,我們會預測一個連續值。也就是說我們試圖將輸入變數和輸出用一個連續函數對應起來;而在分類問題中,我們會預測一個離散值,我們試圖將輸入變數與離散的類別對應起來。
每個數據點都會獲得標注,如類別標簽或與數值相關的標簽。一個類別標簽的例子:將圖片分類為「蘋果」或「橘子」;數值標簽的例子如:預測一套二手房的售價。監督學習的目的是通過學習許多有標簽的樣本,然後對新的數據做出預測。例如,准確識別新照片上的水果(分類)或者預測二手房的售價(回歸)。
無監督學習:
在無監督學習中,我們基本上不知道結果會是什麼樣子,但我們可以通過聚類的方式從數據中提取一個特殊的結構。
在無監督學習中給定的數據是和監督學習中給定的數據是不一樣的。數據點沒有相關的標簽。相反,無監督學習演算法的目標是以某種方式組織數據,然後找出數據中存在的內在結構。這包括將數據進行聚類,或者找到更簡單的方式處理復雜數據,使復雜數據看起來更簡單。
強化學習:
Alphago用的就是強化學習,強化學習是一種學習模型,它並不會直接給你解決方案——你要通過試錯去找到解決方案。
強化學習不需要標簽,你選擇的行動(move)越好,得到的反饋越多,所以你能通過執行這些行動看是輸是贏來學習下圍棋,不需要有人告訴你什麼是好的行動什麼是壞的行動。
給我影響最深的就是參加混沌大學的線下課,是AI的重量級人物Michael I. Jordan講的,其中有一段視頻是一個模擬的人,利用強化學習的演算法,從站不起來到最後能夠正常跑步的過程,而且真正實現的代碼連100行都不到,一頁ppt而已。
總結:
目前用到最多是監督學習和無監督學習,尤其是監督學習,因為應用場景多能給公司創造直接價值,如果找工作可以多關注。
但是強化學習是未來,因為能學習到的能力沒有數據限制。
㈣ 為什麼機器學習可以整合信息
什麼是「整合信息」
機器學習的目標是通過數據來學習出裡面的規律,這個規律體現成數學模型。有了規律 就能進行預測
至於預測功能,是否是你要的整合信息。這個可以討論
㈤ 機器學習兩大系統是啥
機器學習
機器學習(Machine Learning)是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智慧的核心,是使計算機具有智能的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納、綜合而不是演譯。
學習能力是智能行為的一個非常重要的特徵,但至今對學習的機理尚不清楚。人們曾對機器學習給出各種定義。H.A.Simon認為,學習是系統所作的適應性變化,使得系統在下一次完成同樣或類似的任務時更為有效。R.s.Michalski認為,學習是構造或修改對於所經歷事物的表示。從事專家系統研製的人們則認為學習是知識的獲取。這些觀點各有側重,第一種觀點強調學習的外部行為效果,第二種則強調學習的內部過程,而第三種主要是從知識工程的實用性角度出發的。
機器學習在人工智慧的研究中具有十分重要的地位。一個不具有學習能力的智能系統難以稱得上是一個真正的智能系統,但是以往的智能系統都普遍缺少學習的能力。例如,它們遇到錯誤時不能自我校正;不會通過經驗改善自身的性能;不會自動獲取和發現所需要的知識。它們的推理僅限於演繹而缺少歸納,因此至多隻能夠證明已存在事實、定理,而不能發現新的定理、定律和規則等。隨著人工智慧的深入發展,這些局限性表現得愈加突出。正是在這種情形下,機器學習逐漸成為人工智慧研究的核心之一。它的應用已遍及人工智慧的各個分支,如專家系統、自動推理、自然語言理解、模式識別、計算機視覺、智能機器人等領域。其中尤其典型的是專家系統中的知識獲取瓶頸問題,人們一直在努力試圖採用機器學習的方法加以克服。
機器學習的研究是根據生理學、認知科學等對人類學習機理的了解,建立人類學習過程的計算模型或認識模型,發展各種學習理論和學習方法,研究通用的學習演算法並進行理論上的分析,建立面向任務的具有特定應用的學習系統。這些研究目標相互影響相互促進。
自從1980年在卡內基-梅隆大學召開第一屆機器學術研討會以來,機器學習的研究工作發展很快,已成為中心課題之一。
目前,機器學習領域的研究工作主要圍繞以下三個方面進行:
(1)面向任務的研究 研究和分析改進一組預定任務的執行性能的學習系統。
(2)認知模型 研究人類學習過程並進行計算機模擬。
(3)理論分析 從理論上探索各種可能的學習方法和獨立於應用領域的演算法
機器學習是繼專家系統之後人工智慧應用的又一重要研究領域,也是人工智慧和神經計算的核心研究課題之一。現有的計算機系統和人工智慧系統沒有什麼學習能力,至多也只有非常有限的學習能力,因而不能滿足科技和生產提出的新要求。本章將首先介紹機器學習的定義、意義和簡史,然後討論機器學習的主要策略和基本結構,最後逐一研究各種機器學習的方法與技術,包括機械學習、基於解釋的學習、基於事例的學習、基於概念的學習、類比學習和基於訓練神經網路的學習等。對機器學習的討論和機器學習研究的進展,必將促使人工智慧和整個科學技術的進一步發展 。
一、 機器學習的定義和研究意義
學習是人類具有的一種重要智能行為,但究竟什麼是學習,長期以來卻眾說紛紜。社會學家、邏輯學家和心理學家都各有其不同的看法。按照人工智慧大師西蒙的觀點,學習就是系統在不斷重復的工作中對本身能力的增強或者改進,使得系統在下一次執行同樣任務或類似任務時,會比現在做得更好或效率更高。西蒙對學習給出的定義本身,就說明了學習的重要作用。
機器能否象人類一樣能具有學習能力呢?1959年美國的塞繆爾(Samuel)設計了一個下棋程序,這個程序具有學習能力,它可以在不斷的對奕中改善自己的棋藝。4年後,這個程序戰勝了設計者本人。又過了3年,這個程序戰勝了美國一個保持8年之久的常勝不敗的冠軍。這個程序向人們展示了機器學習的能力,提出了許多令人深思的社會問題與哲學問題。
機器的能力是否能超過人的,很多持否定意見的人的一個主要論據是:機器是人造的,其性能和動作完全是由設計者規定的,因此無論如何其能力也不會超過設計者本人。這種意見對不具備學習能力的機器來說的確是對的,可是對具備學習能力的機器就值得考慮了,因為這種機器的能力在應用中不斷地提高,過一段時間之後,設計者本人也不知它的能力到了何種水平。
什麼叫做機器學習(machine learning)?至今,還沒有統一的「機器學習」定義,而且也很難給出一個公認的和准確的定義。為了便於進行討論和估計學科的進展,有必要對機器學習給出定義,即使這種定義是不完全的和不充分的。顧名思義, 機器學習是研究如何使用機器來模擬人類學習活動的一門學科。稍為嚴格的提法是:機器學習是一門研究機器獲取新知識和新技能,並識別現有知識的學問。這里所說的「機器」,指的就是計算機;現在是電子計算機,以後還可能是中子計算機、光子計算機或神經計算機等等
二、 機器學習的發展史
機器學習是人工智慧研究較為年輕的分支,它的發展過程大體上可分為4個時期。
第一階段是在50年代中葉到60年代中葉,屬於熱烈時期。…>
第二階段是在60年代中葉至70年代中葉,被稱為機器學習的冷靜時期。
第三階段是從70年代中葉至80年代中葉,稱為復興時期。
機器學習的最新階段始於1986年。
機器學習進入新階段的重要表現在下列諸方面:
(1) 機器學習已成為新的邊緣學科並在高校形成一門課程。它綜合應用心理學、生物學和神經生理學以及數學、自動化和計算機科學形成機器學習理論基礎。
(2) 結合各種學習方法,取長補短的多種形式的集成學習系統研究正在興起。特別是連接學習符號學習的耦合可以更好地解決連續性信號處理中知識與技能的獲取與求精問題而受到重視。
(3) 機器學習與人工智慧各種基礎問題的統一性觀點正在形成。例如學習與問題求解結合進行、知識表達便於學習的觀點產生了通用智能系統SOAR的組塊學習。類比學習與問題求解結合的基於案例方法已成為經驗學習的重要方向。
(4) 各種學習方法的應用范圍不斷擴大,一部分已形成商品。歸納學習的知識獲取工具已在診斷分類型專家系統中廣泛使用。連接學習在聲圖文識別中占優勢。分析學習已用於設計綜合型專家系統。遺傳演算法與強化學習在工程式控制制中有較好的應用前景。與符號系統耦合的神經網路連接學習將在企業的智能管理與智能機器人運動規劃中發揮作用。
(5) 與機器學習有關的學術活動空前活躍。國際上除每年一次的機器學習研討會外,還有計算機學習理論會議以及遺傳演算法會議。
三、 機器學習的主要策略
學習是一項復雜的智能活動,學習過程與推理過程是緊密相連的,按照學習中使用推理的多少,機器學習所採用的策略大體上可分為4種——機械學習、通過傳授學習、類比學習和通過事例學習。學習中所用的推理越多,系統的能力越強。
四、機器學習系統的基本結構
上圖表示學習系統的基本結構。環境向系統的學習部分提供某些信息,學習部分利用這些信息修改知識庫,以增進系統執行部分完成任務的效能,執行部分根據知識庫完成任務,同時把獲得的信息反饋給學習部分。在具體的應用中,環境,知識庫和執行部分決定了具體的工作內容,學習部分所需要解決的問題完全由上述3部分確定。下面我們分別敘述這3部分對設計學習系統的影響。
影響學習系統設計的最重要的因素是環境向系統提供的信息。或者更具體地說是信息的質量。知識庫里存放的是指導執行部分動作的一般原則,但環境向學習系統提供的信息卻是各種各樣的。如果信息的質量比較高,與一般原則的差別比較小,則學習部分比較容易處理。如果向學習系統提供的是雜亂無章的指導執行具體動作的具體信息,則學習系統需要在獲得足夠數據之後,刪除不必要的細節,進行總結推廣,形成指導動作的一般原則,放入知識庫,這樣學習部分的任務就比較繁重,設計起來也較為困難。
因為學習系統獲得的信息往往是不完全的,所以學習系統所進行的推理並不完全是可靠的,它總結出來的規則可能正確,也可能不正確。這要通過執行效果加以檢驗。正確的規則能使系統的效能提高,應予保留;不正確的規則應予修改或從資料庫中刪除。
知識庫是影響學習系統設計的第二個因素。知識的表示有多種形式,比如特徵向量、一階邏輯語句、產生式規則、語義網路和框架等等。這些表示方式各有其特點,在選擇表示方式時要兼顧以下4個方面:
(1)表達能力強。(2)易於推理。(3)容易修改知識庫。(4)知識表示易於擴展。
對於知識庫最後需要說明的一個問題是學習系統不能在全然沒有任何知識的情況下憑空獲取知識,每一個學習系統都要求具有某些知識理解環境提供的信息,分析比較,做出假設,檢驗並修改這些假設。因此,更確切地說,學習系統是對現有知識的擴展和改進。
執行部分是整個學習系統的核心,因為執行部分的動作就是學習部分力求改進的動作。同執行部分有關的問題有3個:復雜性、反饋和透明性。
五、機器學習分類
1、基於學習策略的分類
學習策略是指學習過程中系統所採用的推理策略。一個學習系統總是由學習和環境兩部分組成。由環境(如書本或教師)提供信息,學習部分則實現信息轉換,用能夠理解的形式記憶下來,並從中獲取有用的信息。在學習過程中,學生(學習部分)使用的推理越少,他對教師(環境)的依賴就越大,教師的負擔也就越重。學習策略的分類標准就是根據學生實現信息轉換所需的推理多少和難易程度來分類的,依從簡單到復雜,從少到多的次序分為以下五種基本類型:
1)機械學習(Rote learning)
學習者無需任何推理或其它的知識轉換,直接吸取環境所提供的信息。如塞繆爾的跳棋程序,紐厄爾和西蒙的LT系統。這類學習系統主要考慮的是如何索引存貯的知識並加以利用。系統的學習方法是直接通過事先編好、構造好的程序來學習,學習者不作任何工作,或者是通過直接接收既定的事實和數據進行學習,對輸入信息不作任何的推理。
2)示教學習(Learning from instruction或Learning by being told)。
學生從環境(教師或其它信息源如教科書等)獲取信息,把知識轉換成內部可使用的表示形式,並將新的知識和原有知識有機地結合為一體。所以要求學生有一定程度的推理能力,但環境仍要做大量的工作。教師以某種形式提出和組織知識,以使學生擁有的知識可以不斷地增加。這種學習方法和人類社會的學校教學方式相似,學習的任務就是建立一個系統,使它能接受教導和建議,並有效地存貯和應用學到的知識。目前,不少專家系統在建立知識庫時使用這種方法去實現知識獲取。示教學習的一個典型應用例是FOO程序。
3)演繹學習(Learning by dection)。
學生所用的推理形式為演譯推理。推理從公理出發,經過邏輯變換推導出結論。這種推理是"保真"變換和特化(specialization)的過程,使學生在推理過程中可以獲取有用的知識。這種學習方法包含宏操作(macro-operation)學習、知識編輯和組塊(Chunking)技術。演繹推理的逆過程是歸納推理。
4)類比學習(Learning by analogy)。
利用二個不同領域(源域、目標域)中的知識相似性,可以通過類比,從源域的知識(包括相似的特徵和其它性質)推導出目標域的相應知識,從而實現學習。類比學習系統可以使一個已有的計算機應用系統轉變為適應於新的領域,來完成原先沒有設計的相類似的功能。類比學習需要比上述三種學習方式更多的推理。它一般要求先從知識源(源域)中檢索出可用的知識,再將其轉換成新的形式,用到新的狀況(目標域)中去。類比學習在人類科學技術發展史上起著重要作用,許多科學發現就是通過類比得到的。例如著名的盧瑟福類比就是通過將原子結構(目標域)同太陽系(源域)作類比,揭示了原子結構的奧秘。
5)基於解釋的學習(Explanation-based learning, EBL)。
學生根據教師提供的目標概念、該概念的一個例子、領域理論及可操作準則,首先構造一個解釋來說明為什該例子滿足目標概念,然後將解釋推廣為目標概念的一個滿足可操作準則的充分條件。EBL已被廣泛應用於知識庫求精和改善系統的性能。著名的EBL系統有迪喬恩(G.DeJong)的GENESIS, 米切爾(T.Mitchell)的LEXII和LEAP, 以及明頓(S.Minton)等的PRODIGY。
6)歸納學習(Learning from inction)。
歸納學習是由教師或環境提供某概念的一些實例或反例,讓學生通過歸納推理得出該概念的一般描述。這種學習的推理工作量遠多於示教學習和演繹學習,因為環境並不提供一般性概念描述(如公理)。從某種程度上說,歸納學習的推理量也比類比學習大,因為沒有一個類似的概念可以作為"源概念"加以取用。歸納學習是最基本的,發展也較為成熟的學習方法,在人工智慧領域中已經得到廣泛的研究和應用。
2、基於所獲取知識的表示形式分類
學習系統獲取的知識可能有:行為規則、物理對象的描述、問題求解策略、各種分類及其它用於任務實現的知識類型。
對於學習中獲取的知識,主要有以下一些表示形式:
1)代數表達式參數:學習的目標是調節一個固定函數形式的代數表達式參數或系數來達到一個理想的性能。
2)決策樹:用決策樹來劃分物體的類屬,樹中每一內部節點對應一個物體屬性,而每一邊對應於這些屬性的可選值,樹的葉節點則對應於物體的每個基本分類。
3)形式文法:在識別一個特定語言的學習中,通過對該語言的一系列表達式進行歸納,形成該語言的形式文法。
4)產生式規則:產生式規則表示為條件—動作對,已被極為廣泛地使用。學習系統中的學習行為主要是:生成、泛化、特化(Specialization)或合成產生式規則。
5)形式邏輯表達式:形式邏輯表達式的基本成分是命題、謂詞、變數、約束變數范圍的語句,及嵌入的邏輯表達式。
6)圖和網路:有的系統採用圖匹配和圖轉換方案來有效地比較和索引知識。
7)框架和模式(schema):每個框架包含一組槽,用於描述事物(概念和個體)的各個方面。
8)計算機程序和其它的過程編碼:獲取這種形式的知識,目的在於取得一種能實現特定過程的能力,而不是為了推斷該過程的內部結構。
9)神經網路:這主要用在聯接學習中。學習所獲取的知識,最後歸納為一個神經網路。
10)多種表示形式的組合:有時一個學習系統中獲取的知識需要綜合應用上述幾種知識表示形式。
根據表示的精細程度,可將知識表示形式分為兩大類:泛化程度高的粗粒度符號表示、??泛化程度低的精粒度亞符號(sub-symbolic)表示。像決策樹、形式文法、產生式規則、形式邏輯表達式、框架和模式等屬於符號表示類;而代數表達式參數、圖和網路、神經網路等則屬亞符號表示類。
3、按應用領域分類
目前最主要的應用領域有: 專家系統、認知模擬、規劃和問題求解、數據挖掘、網路信息服務、圖象識別、故障診斷、自然語言理解、機器人和博弈等領域。
從機器學習的執行部分所反映的任務類型上看,目前大部分的應用研究領域基本上集中於以下兩個范疇:分類和問題求解。
(1)分類任務要求系統依據已知的分類知識對輸入的未知模式(該模式的描述)作分析,以確定輸入模式的類屬。相應的學習目標就是學慣用於分類的准則(如分類規則)。
(2)問題求解任務要求對於給定的目標狀態,??尋找一個將當前狀態轉換為目標狀態的動作序列;機器學習在這一領域的研究工作大部分集中於通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發式知識等)。
4、綜合分類
綜合考慮各種學習方法出現的歷史淵源、知識表示、推理策略、結果評估的相似性、研究人員交流的相對集中性以及應用領域等諸因素。將機器學習方法區分為以下六類:
1)經驗性歸納學習(empirical inctive learning)。
經驗性歸納學習採用一些數據密集的經驗方法(如版本空間法、ID3法,定律發現方法)對例子進行歸納學習。其例子和學習結果一般都採用屬性、謂詞、關系等符號表示。它相當於基於學習策略分類中的歸納學習,但扣除聯接學習、遺傳演算法、加強學習的部分。
2)分析學習(analytic??learning)。
分析學習方法是從一個或少數幾個實例出發,運用領域知識進行分析。其主要特徵為:
·推理策略主要是演繹,而非歸納;
·使用過去的問題求解經驗(實例)指導新的問題求解,或產生能更有效地運用領域知識的搜索控制規則。
分析學習的目標是改善系統的性能,而不是新的概念描述。分析學習包括應用解釋學習、演繹學習、多級結構組塊以及宏操作學習等技術。
3)類比學習。
它相當於基於學習策略分類中的類比學習。目前,在這一類型的學習中比較引人注目的研究是通過與過去經歷的具體事例作類比來學習,稱為基於範例的學習(case_based learning),或簡稱範例學習。
4)遺傳演算法(genetic??algorithm)。
遺傳演算法模擬生物繁殖的突變、交換和達爾文的自然選擇(在每一生態環境中適者生存)。它把問題可能的解編碼為一個向量,稱為個體,向量的每一個元素稱為基因,並利用目標函數(相應於自然選擇標准)對群體(個體的集合)中的每一個個體進行評價,根據評價值(適應度)對個體進行選擇、交換、變異等遺傳操作,從而得到新的群體。遺傳演算法適用於非常復雜和困難的環境,比如,帶有大量雜訊和無關數據、事物不斷更新、問題目標不能明顯和精確地定義,以及通過很長的執行過程才能確定當前行為的價值等。同神經網路一樣,遺傳演算法的研究已經發展為人工智慧的一個獨立分支,其代表人物為霍勒德(J.H.Holland)。
5)聯接學習。
典型的聯接模型實現為人工神經網路,其由稱為神經元的一些簡單計算單元以及單元間的加權聯接組成。
6)加強學習(reinforcement learning)。
加強學習的特點是通過與環境的試探性(trial and error)交互來確定和優化動作的選擇,以實現所謂的序列決策任務。在這種任務中,學習機制通過選擇並執行動作,導致系統狀態的變化,並有可能得到某種強化信號(立即回報),從而實現與環境的交互。強化信號就是對系統行為的一種標量化的獎懲。系統學習的目標是尋找一個合適的動作選擇策略,即在任一給定的狀態下選擇哪種動作的方法,使產生的動作序列可獲得某種最優的結果(如累計立即回報最大)。
在綜合分類中,經驗歸納學習、遺傳演算法、聯接學習和加強學習均屬於歸納學習,其中經驗歸納學習採用符號表示方式,而遺傳演算法、聯接學習和加強學習則採用亞符號表示方式;分析學習屬於演繹學習。
實際上,類比策略可看成是歸納和演繹策略的綜合。因而最基本的學習策略只有歸納和演繹。
從學習內容的角度看,採用歸納策略的學習由於是對輸入進行歸納,所學習的知識顯然超過原有系統知識庫所能蘊涵的范圍,所學結果改變了系統的知識演繹閉包, 因而這種類型的學習又可稱為知識級學習;而採用演繹策略的學習盡管所學的知識能提高系統的效率,但仍能被原有系統的知識庫所蘊涵,即所學的知識未能改變系統的演繹閉包,因而這種類型的學習又被稱為符號級學習。
㈥ 機器學習中的Bias(偏差),Error(誤差),和Variance(方差)有什麼區別和聯系
Error = Bias + Variance
誤差反映了整個模型的准確性,偏差,反映了模型對樣本輸出與實際值之間的誤差,模型本身的精度,每次輸出的方差反映了模型與模型輸出期望之間的誤差,模型的穩定性。因此,例如在目標實驗中,目標是打10個環,但實際上只打7個,所以這里的誤差是3.可以有兩個理由來具體分析七個環:一個是針對問題,例如,實際拍攝目標是9環而不是10環;第二個是槍本身的穩定性,雖然目標是9個戒指,但只有7個戒指。
所以我們越多的試驗,我們越接近,所以我們將平均所有的目標,我們應該更接近中心。更微觀的分析,模型的預測值和期望有較大的偏差。在固定模型的情況下,原因還在數據中,例如產生了一些異常點。在最極端的情況下,我們假設只有一個點是異常的,如果只有一個模型訓練,那麼這個點會影響到整個模型,使得學習模型有很大的差異。
但是,如果使用k倍交叉驗證進行訓練,則只有一個模型會受到這個異常數據的影響,而其餘的k-1模型是正常的。平均而言,這個異常數據的影響大大減少。模型,相比之下,偏差可以是直接建模,只要確保訓練樣本中訓練樣本的最小誤差可以保證較小,而要實現這個目標,就必須將所有的數據訓練在一起,才能達到最優該模型的解決方案。因此,k-fold交叉驗證的目標函數破壞了以前的情況,所以模型的偏差必然會增加。
㈦ AI,機器學習和深度學習的區別到底是什麼
簡單來說,機器學習是實現人工智慧的方法,深度學習是實現機器學習的技術。機器學習在實現人工智慧時中需要人工輔助(半自動),而深度學習使該過程完全自動化
三者關系:
舉個例子:通過機器學習演算法來識別水果是橘子還是蘋果,需要人工輸入水果的特徵數據,生成一定的演算法模型,進而可以准確預測具有這些特徵的水果的類型,而深度學習則能自動的去發現特徵進而判斷。
㈧ 機器學習的類型有哪些
基於學習策略的分類
學習策略是指學習過程中系統所採用的推理策略。一個學習系統總是由學習和環境兩部分組成。由環境(如書本或教師)提供信息,學習部分則實現信息轉換,用能夠理解的形式記憶下來,並從中獲取有用的信息。在學習過程中,學生(學習部分)使用的推理越少,他對教師(環境)的依賴就越大,教師的負擔也就越重。學習策略的分類標准就是根據學生實現信息轉換所需的推理多少和難易程度來分類的,依從簡單到復雜,從少到多的次序分為以下六種基本類型:
1)機械學習 (Rote learning)
學習者無需任何推理或其它的知識轉換,直接吸取環境所提供的信息。如塞繆爾的跳棋程序,紐厄爾和西蒙的LT系統。這類學習系統主要考慮的是如何索引存貯的知識並加以利用。系統的學習方法是直接通過事先編好、構造好的程序來學習,學習者不作任何工作,或者是通過直接接收既定的事實和數據進行學習,對輸入信息不作任何的推理。
2)示教學習 (Learning from instruction或Learning by being told)
學生從環境(教師或其它信息源如教科書等)獲取信息,把知識轉換成內部可使用的表示形式,並將新的知識和原有知識有機地結合為一體。所以要求學生有一定程度的推理能力,但環境仍要做大量的工作。教師以某種形式提出和組織知識,以使學生擁有的知識可以不斷地增加。這種學習方法和人類社會的學校教學方式相似,學習的任務就是建立一個系統,使它能接受教導和建議,並有效地存貯和應用學到的知識。不少專家系統在建立知識庫時使用這種方法去實現知識獲取。示教學習的一個典型應用例是FOO程序。
3)演繹學習 (Learning by dection)
學生所用的推理形式為演繹推理。推理從公理出發,經過邏輯變換推導出結論。這種推理是"保真"變換和特化(specialization)的過程,使學生在推理過程中可以獲取有用的知識。這種學習方法包含宏操作(macro-operation)學習、知識編輯和組塊(Chunking)技術。演繹推理的逆過程是歸納推理。
4)類比學習 (Learning by analogy)
利用二個不同領域(源域、目標域)中的知識相似性,可以通過類比,從源域的知識(包括相似的特徵和其它性質)推導出目標域的相應知識,從而實現學習。類比學習系統可以使一個已有的計算機應用系統轉變為適應於新的領域,來完成原先沒有設計的相類似的功能。
類比學習需要比上述三種學習方式更多的推理。它一般要求先從知識源(源域)中檢索出可用的知識,再將其轉換成新的形式,用到新的狀況(目標域)中去。類比學習在人類科學技術發展史上起著重要作用,許多科學發現就是通過類比得到的。例如著名的盧瑟福類比就是通過將原子結構(目標域)同太陽系(源域)作類比,揭示了原子結構的奧秘。
5)基於解釋的學習 (Explanation-based learning, EBL)
學生根據教師提供的目標概念、該概念的一個例子、領域理論及可操作準則,首先構造一個解釋來說明為什該例子滿足目標概念,然後將解釋推廣為目標概念的一個滿足可操作準則的充分條件。EBL已被廣泛應用於知識庫求精和改善系統的性能。
著名的EBL系統有迪喬恩(G.DeJong)的GENESIS,米切爾(T.Mitchell)的LEXII和LEAP, 以及明頓(S.Minton)等的PRODIGY。
6)歸納學習 (Learning from inction)
歸納學習是由教師或環境提供某概念的一些實例或反例,讓學生通過歸納推理得出該概念的一般描述。這種學習的推理工作量遠多於示教學習和演繹學習,因為環境並不提供一般性概念描述(如公理)。從某種程度上說,歸納學習的推理量也比類比學習大,因為沒有一個類似的概念可以作為"源概念"加以取用。歸納學習是最基本的,發展也較為成熟的學習方法,在人工智慧領域中已經得到廣泛的研究和應用。
基於所獲取知識的表示形式分類
學習系統獲取的知識可能有:行為規則、物理對象的描述、問題求解策略、各種分類及其它用於任務實現的知識類型。
對於學習中獲取的知識,主要有以下一些表示形式:
1)代數表達式參數
學習的目標是調節一個固定函數形式的代數表達式參數或系數來達到一個理想的性能。
2)決策樹
用決策樹來劃分物體的類屬,樹中每一內部節點對應一個物體屬性,而每一邊對應於這些屬性的可選值,樹的葉節點則對應於物體的每個基本分類。
3)形式文法
在識別一個特定語言的學習中,通過對該語言的一系列表達式進行歸納,形成該語言的形式文法。
4)產生式規則
產生式規則表示為條件—動作對,已被極為廣泛地使用。學習系統中的學習行為主要是:生成、泛化、特化(Specialization)或合成產生式規則。
5)形式邏輯表達式
形式邏輯表達式的基本成分是命題、謂詞、變數、約束變數范圍的語句,及嵌入的邏輯表達式。
6)圖和網路
有的系統採用圖匹配和圖轉換方案來有效地比較和索引知識。
7)框架和模式(schema)
每個框架包含一組槽,用於描述事物(概念和個體)的各個方面。
8)計算機程序和其它的過程編碼
獲取這種形式的知識,目的在於取得一種能實現特定過程的能力,而不是為了推斷該過程的內部結構。
9)神經網路
這主要用在聯接學習中。學習所獲取的知識,最後歸納為一個神經網路。
10)多種表示形式的組合
有時一個學習系統中獲取的知識需要綜合應用上述幾種知識表示形式。
根據表示的精細程度,可將知識表示形式分為兩大類:泛化程度高的粗粒度符號表示、??泛化程度低的精粒度亞符號(sub-symbolic)表示。像決策樹、形式文法、產生式規則、形式邏輯表達式、框架和模式等屬於符號表示類;而代數表達式參數、圖和網路、神經網路等則屬亞符號表示類。
按應用領域分類
最主要的應用領域有:專家系統、認知模擬、規劃和問題求解、數據挖掘、網路信息服務、圖象識別、故障診斷、自然語言理解、機器人和博弈等領域。
從機器學習的執行部分所反映的任務類型上看,大部分的應用研究領域基本上集中於以下兩個范疇:分類和問題求解。
(1)分類任務要求系統依據已知的分類知識對輸入的未知模式(該模式的描述)作分析,以確定輸入模式的類屬。相應的學習目標就是學慣用於分類的准則(如分類規則)。
(2)問題求解任務要求對於給定的目標狀態,??尋找一個將當前狀態轉換為目標狀態的動作序列;機器學習在這一領域的研究工作大部分集中於通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發式知識等)。
綜合分類
綜合考慮各種學習方法出現的歷史淵源、知識表示、推理策略、結果評估的相似性、研究人員交流的相對集中性以及應用領域等諸因素。將機器學習方法[1] 區分為以下六類:
1)經驗性歸納學習 (empirical inctive learning)
經驗性歸納學習採用一些數據密集的經驗方法(如版本空間法、ID3法,定律發現方法)對例子進行歸納學習。其例子和學習結果一般都採用屬性、謂詞、關系等符號表示。它相當於基於學習策略分類中的歸納學習,但扣除聯接學習、遺傳演算法、加強學習的部分。
2)分析學習(analytic learning)
分析學習方法是從一個或少數幾個實例出發,運用領域知識進行分析。其主要特徵為:
·推理策略主要是演繹,而非歸納;
·使用過去的問題求解經驗(實例)指導新的問題求解,或產生能更有效地運用領域知識的搜索控制規則。
分析學習的目標是改善系統的性能,而不是新的概念描述。分析學習包括應用解釋學習、演繹學習、多級結構組塊以及宏操作學習等技術。
3)類比學習
它相當於基於學習策略分類中的類比學習。在這一類型的學習中比較引人注目的研究是通過與過去經歷的具體事例作類比來學習,稱為基於範例的學習(case_based learning),或簡稱範例學習。
4)遺傳演算法(genetic algorithm)
遺傳演算法模擬生物繁殖的突變、交換和達爾文的自然選擇(在每一生態環境中適者生存)。它把問題可能的解編碼為一個向量,稱為個體,向量的每一個元素稱為基因,並利用目標函數(相應於自然選擇標准)對群體(個體的集合)中的每一個個體進行評價,根據評價值(適應度)對個體進行選擇、交換、變異等遺傳操作,從而得到新的群體。遺傳演算法適用於非常復雜和困難的環境,比如,帶有大量雜訊和無關數據、事物不斷更新、問題目標不能明顯和精確地定義,以及通過很長的執行過程才能確定當前行為的價值等。同神經網路一樣,遺傳演算法的研究已經發展為人工智慧的一個獨立分支,其代表人物為霍勒德(J.H.Holland)。
5)聯接學習
典型的聯接模型實現為人工神經網路,其由稱為神經元的一些簡單計算單元以及單元間的加權聯接組成。
6)增強學習(reinforcement learning)
增強學習的特點是通過與環境的試探性(trial and error)交互來確定和優化動作的選擇,以實現所謂的序列決策任務。在這種任務中,學習機制通過選擇並執行動作,導致系統狀態的變化,並有可能得到某種強化信號(立即回報),從而實現與環境的交互。強化信號就是對系統行為的一種標量化的獎懲。系統學習的目標是尋找一個合適的動作選擇策略,即在任一給定的狀態下選擇哪種動作的方法,使產生的動作序列可獲得某種最優的結果(如累計立即回報最大)。
在綜合分類中,經驗歸納學習、遺傳演算法、聯接學習和增強學習均屬於歸納學習,其中經驗歸納學習採用符號表示方式,而遺傳演算法、聯接學習和加強學習則採用亞符號表示方式;分析學習屬於演繹學習。
實際上,類比策略可看成是歸納和演繹策略的綜合。因而最基本的學習策略只有歸納和演繹。
從學習內容的角度看,採用歸納策略的學習由於是對輸入進行歸納,所學習的知識顯然超過原有系統知識庫所能蘊涵的范圍,所學結果改變了系統的知識演繹閉包, 因而這種類型的學習又可稱為知識級學習;而採用演繹策略的學習盡管所學的知識能提高系統的效率,但仍能被原有系統的知識庫所蘊涵,即所學的知識未能改變系統的演繹閉包,因而這種類型的學習又被稱為符號級學習。
學習形式分類
1)監督學習(supervised learning)
監督學習,即在機械學習過程中提供對錯指示。一般實在是數據組中包含最終結果(0,1)。通過演算法讓機器自我減少誤差。這一類學習主要應用於分類和預測 (regression & classify)。監督學習從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標注的。常見的監督學習演算法包括回歸分析和統計分類。
2)非監督學習(unsupervised learning)
非監督學習又稱歸納性學習(clustering)利用K方式(Kmeans),建立中心(centriole),通過循環和遞減運算(iteration&descent)來減小誤差,達到分類的目的。
㈨ 去中心化金融與傳統金融系統有什麼不同
相比傳統的中心化金融系統,去中心化金融平台具有三大優勢:
a. 有資產管理需求的個人無需信任任何中介機構新的信任在機器和代碼上重建;
b. 任何人都有訪問許可權,沒人有中央控制權;
c. 所有協議都是開源的,因此任何人都可以在協議上合作構建新的金融產品,並在網路效應下加速金融創新。
DeFi是個較為寬泛的概念,包括:貨幣發行、貨幣交易、借貸、資產交易、投融資等。
我們將BTC和其他加密貨幣的誕生視為去中心化金融的第一階段。然而將貨幣的發行和存儲分散化只是提供了點對點結算的解決方案,還不足以支撐豐富的金融業務。而近兩年發展迅猛的去中心化借貸協議將有機會進一步開放區塊鏈世界的金融系統,將去中心化金融帶入第二階段。
鏈喬教育在線旗下學碩創新區塊鏈技術工作站是中國教育部學校規劃建設發展中心開展的「智慧學習工場2020-學碩創新工作站 」唯一獲準的「區塊鏈技術專業」試點工作站。專業站立足為學生提供多樣化成長路徑,推進專業學位研究生產學研結合培養模式改革,構建應用型、復合型人才培養體系。
㈩ 機器學習和計算機視覺是什麼關系
從概念的提出到走向繁榮
1956年,幾個計算機科學家相聚在達特茅斯會議(Dartmouth Conferences),提出了「人工智慧」的概念。其後,人工智慧就一直縈繞於人們的腦海之中,並在科研實驗室中慢慢孵化。之後的幾十年,人工智慧一直在兩極反轉,或被稱作人類文明耀眼未來的預言;或者被當成技術瘋子的狂想扔到垃圾堆里。坦白說,直到2012年之前,這兩種聲音還在同時存在。
過去幾年,尤其是2015年以來,人工智慧開始大爆發。很大一部分是由於GPU的廣泛應用,使得並行計算變得更快、更便宜、更有效。當然,無限拓展的存儲能力和驟然爆發的數據洪流(大數據)的組合拳,也使得圖像數據、文本數據、交易數據、映射數據全面海量爆發。
讓我們慢慢梳理一下計算機科學家們是如何將人工智慧從最早的一點點苗頭,發展到能夠支撐那些每天被數億用戶使用的應用的。
人工智慧(Artificial Intelligence)——為機器賦予人的智能
成王(King me):能下國際跳棋的程序是早期人工智慧的一個典型應用,在二十世紀五十年代曾掀起一陣風潮。(譯者註:國際跳棋棋子到達底線位置後,可以成王,成王棋子可以向後移動)。
早在1956年夏天那次會議,人工智慧的先驅們就夢想著用當時剛剛出現的計算機來構造復雜的、擁有與人類智慧同樣本質特性的機器。這就是我們現在所說的「強人工智慧」(General AI)。這個無所不能的機器,它有著我們所有的感知(甚至比人更多),我們所有的理性,可以像我們一樣思考。
人們在電影里也總是看到這樣的機器:友好的,像星球大戰中的C-3PO;邪惡的,如終結者。強人工智慧現在還只存在於電影和科幻小說中,原因不難理解,我們還沒法實現它們,至少目前還不行。
我們目前能實現的,一般被稱為「弱人工智慧」(Narrow AI)。弱人工智慧是能夠與人一樣,甚至比人更好地執行特定任務的技術。例如,Pinterest上的圖像分類;或者Facebook的人臉識別。
這些是弱人工智慧在實踐中的例子。這些技術實現的是人類智能的一些具體的局部。但它們是如何實現的?這種智能是從何而來?這就帶我們來到同心圓的裡面一層,機器學習。
機器學習—— 一種實現人工智慧的方法
健康食譜(Spam free diet):機器學習能夠幫你過濾電子信箱里的(大部分)垃圾郵件。(譯者註:英文中垃圾郵件的單詞spam來源於二戰中美國曾大量援助英國的午餐肉品牌SPAM。直到六十年代,英國的農業一直沒有從二戰的損失中恢復,因而從美國大量進口了這種廉價的罐頭肉製品。據傳聞不甚好吃且充斥市場。)
機器學習最基本的做法,是使用演算法來解析數據、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟體程序不同,機器學習是用大量的數據來「訓練」,通過各種演算法從數據中學習如何完成任務。
機器學習直接來源於早期的人工智慧領域。傳統演算法包括決策樹學習、推導邏輯規劃、聚類、強化學習和貝葉斯網路等等。眾所周知,我們還沒有實現強人工智慧。早期機器學習方法甚至都無法實現弱人工智慧。
機器學習最成功的應用領域是計算機視覺,雖然也還是需要大量的手工編碼來完成工作。人們需要手工編寫分類器、邊緣檢測濾波器,以便讓程序能識別物體從哪裡開始,到哪裡結束;寫形狀檢測程序來判斷檢測對象是不是有八條邊;寫分類器來識別字母「ST-O-P」。使用以上這些手工編寫的分類器,人們總算可以開發演算法來感知圖像,判斷圖像是不是一個停止標志牌。
這個結果還算不錯,但並不是那種能讓人為之一振的成功。特別是遇到雲霧天,標志牌變得不是那麼清晰可見,又或者被樹遮擋一部分,演算法就難以成功了。這就是為什麼前一段時間,計算機視覺的性能一直無法接近到人的能力。它太僵化,太容易受環境條件的干擾。
隨著時間的推進,學習演算法的發展改變了一切。
深度學習——一種實現機器學習的技術
放貓(Herding Cats):從YouTube視頻裡面尋找貓的圖片是深度學習傑出性能的首次展現。(譯者註:herdingcats是英語習語,照顧一群喜歡自由,不喜歡馴服的貓,用來形容局面混亂,任務難以完成。)
人工神經網路(Artificial Neural Networks)是早期機器學習中的一個重要的演算法,歷經數十年風風雨雨。神經網路的原理是受我們大腦的生理結構——互相交叉相連的神經元啟發。但與大腦中一個神經元可以連接一定距離內的任意神經元不同,人工神經網路具有離散的層、連接和數據傳播的方向。
例如,我們可以把一幅圖像切分成圖像塊,輸入到神經網路的第一層。在第一層的每一個神經元都把數據傳遞到第二層。第二層的神經元也是完成類似的工作,把數據傳遞到第三層,以此類推,直到最後一層,然後生成結果。
每一個神經元都為它的輸入分配權重,這個權重的正確與否與其執行的任務直接相關。最終的輸出由這些權重加總來決定。
我們仍以停止(Stop)標志牌為例。將一個停止標志牌圖像的所有元素都打碎,然後用神經元進行「檢查」:八邊形的外形、救火車般的紅顏色、鮮明突出的字母、交通標志的典型尺寸和靜止不動運動特性等等。神經網路的任務就是給出結論,它到底是不是一個停止標志牌。神經網路會根據所有權重,給出一個經過深思熟慮的猜測——「概率向量」。
這個例子里,系統可能會給出這樣的結果:86%可能是一個停止標志牌;7%的可能是一個限速標志牌;5%的可能是一個風箏掛在樹上等等。然後網路結構告知神經網路,它的結論是否正確。
即使是這個例子,也算是比較超前了。直到前不久,神經網路也還是為人工智慧圈所淡忘。其實在人工智慧出現的早期,神經網路就已經存在了,但神經網路對於「智能」的貢獻微乎其微。主要問題是,即使是最基本的神經網路,也需要大量的運算。神經網路演算法的運算需求難以得到滿足。
不過,還是有一些虔誠的研究團隊,以多倫多大學的Geoffrey Hinton為代表,堅持研究,實現了以超算為目標的並行演算法的運行與概念證明。但也直到GPU得到廣泛應用,這些努力才見到成效。
我們回過頭來看這個停止標志識別的例子。神經網路是調制、訓練出來的,時不時還是很容易出錯的。它最需要的,就是訓練。需要成百上千甚至幾百萬張圖像來訓練,直到神經元的輸入的權值都被調製得十分精確,無論是否有霧,晴天還是雨天,每次都能得到正確的結果。
只有這個時候,我們才可以說神經網路成功地自學習到一個停止標志的樣子;或者在Facebook的應用里,神經網路自學習了你媽媽的臉;又或者是2012年吳恩達(Andrew Ng)教授在Google實現了神經網路學習到貓的樣子等等。
吳教授的突破在於,把這些神經網路從基礎上顯著地增大了。層數非常多,神經元也非常多,然後給系統輸入海量的數據,來訓練網路。在吳教授這里,數據是一千萬YouTube視頻中的圖像。吳教授為深度學習(deep learning)加入了「深度」(deep)。這里的「深度」就是說神經網路中眾多的層。
現在,經過深度學習訓練的圖像識別,在一些場景中甚至可以比人做得更好:從識別貓,到辨別血液中癌症的早期成分,到識別核磁共振成像中的腫瘤。Google的AlphaGo先是學會了如何下圍棋,然後與它自己下棋訓練。它訓練自己神經網路的方法,就是不斷地與自己下棋,反復地下,永不停歇。
深度學習,給人工智慧以璀璨的未來
深度學習使得機器學習能夠實現眾多的應用,並拓展了人工智慧的領域范圍。深度學習摧枯拉朽般地實現了各種任務,使得似乎所有的機器輔助功能都變為可能。無人駕駛汽車,預防性醫療保健,甚至是更好的電影推薦,都近在眼前,或者即將實現。
人工智慧就在現在,就在明天。有了深度學習,人工智慧甚至可以達到我們暢想的科幻小說一般。你的C-3PO我拿走了,你有你的終結者就好了。