圖像質量對神經網路算力的影響

發布時間: 2021-05-13 04:22:45

㈠怎樣獲得圖片的像素作為神經網路的輸入

卷積神經網路有以下幾種應用可供研究： 1、基於卷積網路的形狀識別物體的形狀是人的視覺系統分析和識別物體的基礎，幾何形狀是物體的本質特徵的表現，並具有平移、縮放和旋轉不變等特點，所以在模式識別領域，對於形狀的分析和識別具有十分重要的意義，而二維圖像作為三維圖像的特例以及組成部分，因此二維圖像的識別是三維圖像識別的基礎。 2、基於卷積網路的人臉檢測卷積神經網路與傳統的人臉檢測方法不同，它是通過直接作用於輸入樣本，用樣本來訓練網路並最終實現檢測任務的。它是非參數型的人臉檢測方法，可以省去傳統方法中建模、參數估計以及參數檢驗、重建模型等的一系列復雜過程。本文針對圖像中任意大小、位置、姿勢、方向、膚色、面部表情和光照條件的人臉。 3、文字識別系統在經典的模式識別中，一般是事先提取特徵。提取諸多特徵後，要對這些特徵進行相關性分析，找到最能代表字元的特徵，去掉對分類無關和自相關的特徵。然而，這些特徵的提取太過依賴人的經驗和主觀意識，提取到的特徵的不同對分類性能影響很大，甚至提取的特徵的順序也會影響最後的分類性能。同時，圖像預處理的好壞也會影響到提取的特徵。

㈡神經網路訓練過程中圖片像素對訓練結果有什麼影響，由於GPU內存太小，將224*224改成了120*120

有影響像素越高相對需要的網路結構更復雜優化技術更好訓練時間更長超參數的設置等
就好比CIFAR數據集和ImageNet數據集面對的數據集不同上述的組件都要相應發生變化
GPU太小的話可以考慮圖像降采樣、batch_size設置小一點、網路結構適當壓縮等

㈢神經網路在圖像識別中有哪些應用

卷積神經網路有以下幾種應用可供研究：
1、基於卷積網路的形狀識別
物體的形狀是人的視覺系統分析和識別物體的基礎，幾何形狀是物體的本質特徵的表現，並具有平移、縮放和旋轉不變等特點，所以在模式識別領域，對於形狀的分析和識別具有十分重要的意義，而二維圖像作為三維圖像的特例以及組成部分，因此二維圖像的識別是三維圖像識別的基礎。
2、基於卷積網路的人臉檢測
卷積神經網路與傳統的人臉檢測方法不同，它是通過直接作用於輸入樣本，用樣本來訓練網路並最終實現檢測任務的。它是非參數型的人臉檢測方法，可以省去傳統方法中建模、參數估計以及參數檢驗、重建模型等的一系列復雜過程。本文針對圖像中任意大小、位置、姿勢、方向、膚色、面部表情和光照條件的人臉。
3、文字識別系統
在經典的模式識別中，一般是事先提取特徵。提取諸多特徵後，要對這些特徵進行相關性分析，找到最能代表字元的特徵，去掉對分類無關和自相關的特徵。然而，這些特徵的提取太過依賴人的經驗和主觀意識，提取到的特徵的不同對分類性能影響很大，甚至提取的特徵的順序也會影響最後的分類性能。同時，圖像預處理的好壞也會影響到提取的特徵。

㈣本人畢設題目是關於神經網路用於圖像識別方面的，但是很沒有頭續~我很不理解神經網路作用的這一機理

我簡單說一下，舉個例子，比如說我們現在搭建一個識別蘋果和橘子的網路模型：
我們現在得需要兩組數據，一組表示特徵值，就是網路的輸入（p），另一組是導師信號，告訴網路是橘子還是蘋果（網路輸出t）：
我們的樣本這樣子假設（就是Sampledata1.txt）：
p t
1 0 3 1
2 1 4 2
這兩組數據是這樣子解釋的：
我們假設通過3個特徵來識別一個水果是橘子還是蘋果：形狀，顏色，味道，第一組形狀、顏色、味道分別為：1 0 3（當然這些數都是我隨便亂編的，這個可以根據實際情況自己定義），有如上特徵的水果就是蘋果（t為1），而形狀、顏色、味道為：2 1 4的表示這是一個橘子（t為2）。
好了，我們的網路模型差不多出來了，輸入層節點數為3個（形狀、顏色，味道），輸出層節點為一個（1為蘋果2為橘子），隱藏層我們設為一層，節點數先不管，因為這是一個經驗值，還有另外的一些參數值可以在matlab里設定，比如訓練函數，訓練次數之類，我們現在開始訓練網路了，首先要初始化權值，輸入第一組輸入：1 0 3 ,網路會輸出一個值，我們假設為4，那麼根據導師信號（正確的導師信號為1，表示這是一個蘋果）計算誤差4-1=3，誤差傳給bp神經網路，神經網路根據誤差調整權值，然後進入第二輪循環，那麼我們再次輸入一組數據：2 0 4（當仍然你可以還輸入1 0 3，而且如果你一直輸入蘋果的特徵，這樣子會讓網路只識別蘋果而不會識別橘子了，這回明白你的問題所在了吧），同理輸出一個值，再次反饋給網路，這就是神經網路訓練的基本流程，當然這兩組數據肯定不夠了，如果數據足夠多，我們會讓神經網路的權值調整到一個非常理想的狀態，是什麼狀態呢，就是網路再次輸出後誤差很小，而且小於我們要求的那個誤差值。
接下來就要進行模擬預測了t_1=sim(net,p)，net就是你建立的那個網路，p是輸入數據，由於網路的權值已經確定了，我們這時候就不需要知道t的值了，也就是說不需要知道他是蘋果還是橘子了，而t_1就是網路預測的數據，它可能是1或者是2，也有可能是1.3，2.2之類的數（絕大部分都是這種數），那麼你就看這個數十接近1還是2了，如果是1.5，我們就認為他是蘋果和橘子的雜交，呵呵，開玩笑的，遇到x<=0,5、x=1.5、x>=2.5，我一般都是舍棄的，表示未知。

總之就是你需要找本資料系統的看下，鑒於我也是做圖像處理的，我給你個關鍵的提醒，用神經網路做圖像處理的話必須有好的樣本空間，就是你的資料庫必須是標準的。至於網路的機理，訓練的方法什麼的，找及個例子用matlab模擬下，看看效果，自己琢磨去吧，這裡面主要是你隱含層的設置，訓練函數選擇及其收斂速度以及誤差精度就是神經網路的真諦了，想在這么小的空間給你介紹清楚是不可能的，關鍵是樣本，提取的圖像特徵必須帶有相關性，這樣設置的各個閾值才有效。OK，好好學習吧，資料去matlab中文論壇上找，在不行就去bau文庫上，你又不需要都用到，何必看一本書呢！祝你順利畢業！

㈤新型神經網路晶元會對科技領域乃至整個世界產生什麼巨大影響

一、與傳統計算機的區別1946年美籍匈牙利科學家馮·諾依曼提出存儲程序原理，把程序本身當作數據來對待。此後的半個多世紀以來，計算機的發展取得了巨大的進步，但「馮·諾依曼架構」中信息存儲器和處理器的設計一直沿用至今，連接存儲器和處理器的信息傳遞通道仍然通過匯流排來實現。隨著處理的數據量海量地增長，匯流排有限的數據傳輸速率被稱為「馮·諾依曼瓶頸」——尤其是移動互聯網、社交網路、物聯網、雲計算、高通量測序等的興起，使得『馮·諾依曼瓶頸』日益突出，而計算機的自我糾錯能力缺失的局限性也已成為發展障礙。
結構上的缺陷也導致功能上的局限。例如，從效率上看，計算機運算的功耗較高——盡管人腦處理的信息量不比計算機少，但顯然而功耗低得多。為此，學習更多層的神經網路，讓計算機能夠更好地模擬人腦功能，成為上世紀後期以來研究的熱點。
在這些研究中，核心的研究是「馮·諾依曼架構」與「人腦架構」的本質結構區別——與計算機相比，人腦的信息存儲和處理，通過突觸這一基本單元來實現，因而沒有明顯的界限。正是人腦中的千萬億個突觸的可塑性——各種因素和各種條件經過一定的時間作用後引起的神經變化（可變性、可修飾性等），使得人腦的記憶和學習功能得以實現。

大腦有而計算機沒有的三個特性:低功耗（人腦的能耗僅約20瓦，而目前用來嘗試模擬人腦的超級計算機需要消耗數兆瓦的能量）；容錯性（壞掉一個晶體管就能毀掉一塊微處理器，但是大腦的神經元每時每刻都在死亡）；還有不需為其編製程序（大腦在與外界互動的同時也會進行學習和改變，而不是遵循預設演算法的固定路徑和分支運行。）

這段描述可以說是「電」腦的最終理想了吧。
註：最早的電腦也是模擬電路實現的，之後發展成現在的只有0、1的數字CPU。
今天的計算機用的都是所謂的馮諾依曼結構，在一個中央處理器和記憶晶元之間以線性計算序列來回傳輸數據。這種方式在處理數字和執行精確撰寫的程序時非常好用，但在處理圖片或聲音並理解它們的意義時效果不佳。
有件事很說明問題：2012年，谷歌展示了它的人工智慧軟體在未被告知貓是什麼東西的情況下，可以學會識別視頻中的貓，而完成這個任務用到了1.6萬台處理器。
要繼續改善這類處理器的性能，生產商得在其中配備更多更快的晶體管、硅存儲緩存和數據通路，但所有這些組件產生的熱量限制了晶元的運作速度，尤其在電力有限的移動設備中。這可能會阻礙人們開發出有效處理圖片、聲音和其他感官信息的設備，以及將其應用於面部識別、機器人，或者交通設備航運等任務中。

神經形態晶元嘗試在矽片中模仿人腦以大規模的平行方式處理信息：幾十億神經元和千萬億個突觸對視覺和聲音刺激物這類感官輸入做出反應。

作為對圖像、聲音等內容的反應，這些神經元也會改變它們相互間連接的方式，我們把這個過程叫做學習。神經形態晶元納入了受人腦啟發的「神經網路」模式，因此能做同樣的事。
人工智慧的頂尖思想家傑夫·霍金斯（Jeff Hawkins）說，在傳統處理器上用專門的軟體嘗試模擬人腦（谷歌在貓實驗中所做的），以此作為不斷提升的智能基礎，這太過低效了。
霍金斯創造了掌上電腦（Palm Pilot），後來又聯合創辦了Numenta公司，後者製造從人腦中獲得啟發的軟體。「你不可能只在軟體中建造它，」他說到人工智慧，「你必須在矽片中建造它。」
現有的計算機計算，程序的執行是一行一行執行的，而神經網路計算機則有所不同。
現行的人工智慧程式，基本上都是將大大小小的各種知識寫成一句一句的陳述句，再灌進系統之中。當輸入問題進去智能程式時，它就會搜尋本身的資料庫，再選擇出最佳或最近解。2011年時，IBM 有名的 Watson 智能電腦，便是使用這樣的技術，在美國的電視益智節目中打敗的人類的最強衛冕者。
（神經網路計算機）以這種非同步信號發送（因沒有能使其同步的中央時鍾而得名）處理數據的速度比同步信號發送更快，以為沒有時間浪費在等待時鍾發出信號上。非同步信號發送消耗的能量也更少，這樣便滿足了邁耶博士理想的計算機的第一個特點。如果有一個處理器壞了，系統會從另一路線繞過它，這樣便滿足了邁耶博士理想的計算機的第二個特點。正是由於為非同步信號發送編程並不容易，所以大多數計算機工程師都無視於此。然而其作為一種模仿大腦的方式堪稱完美。功耗方面：
硬體方面，近年來主要是通過對大型神經網路進行模擬，如 Google 的深度學習系統Google Brain，微軟的Adam等。但是這些網路需要大量傳統計算機的集群。比方說 Google Brain 就採用了 1000 台各帶 16 核處理器的計算機，這種架構盡管展現出了相當的能力，但是能耗依然巨大。而 IBM 則是在晶元上的模仿。4096 個內核，100 萬個「神經元」、2.56 億個「突觸」集成在直徑只有幾厘米的方寸（是 2011 年原型大小的 1/16）之間，而且能耗只有不到 70 毫瓦。
IBM 研究小組曾經利用做過 DARPA 的NeoVision2 Tower數據集做過演示。它能夠實時識別出用 30 幀每秒的正常速度拍攝自斯坦福大學胡佛塔的十字路口視頻中的人、自行車、公交車、卡車等，准確率達到了 80%。相比之下，一台筆記本編程完成同樣的任務用時要慢 100 倍，能耗卻是 IBM 晶元的 1 萬倍。

Ref: A million spiking-neuron integrated circuit with a scalable communication network and interface. Paul A. Merolla et al. Science 345, 668 (2014); DOI: 10.1126/science.1254642
因為需要擁有極多數據的Database 來做training以及需要極強大的計算能力來做prediction，現有的一些Deep learning如Andrew Ng的Google Brain、Apple的Siri等都需要連接網路到雲端的伺服器。

二、爭議：
雖然深度學習已經被應用到尖端科學研究及日常生活當中，而 Google 已經實際搭載在核心的搜尋功能之中。但其他知名的人工智慧實驗室，對於深度學習技術的反應並不一致。例如艾倫人工智慧中心的執行長 Oren Etzioni，就沒有考慮將深度學習納入當前開發中的人工智慧系統中。該機構目前的研究是以小學程度的科學知識為目標，希望能開發出光是看學校的教科書，就能夠輕松應付各類考試的智能程式。Oren Etzioni 以飛機為例，他表示，最成功的飛機設計都不是來自於模仿鳥的結構，所以腦神經的類比並無法保證人工智慧的實現，因此他們暫不考慮借用深度學習技術來開發這個系統。
但是從短期來看，情況也許並沒有那麼樂觀。
首先晶元的編程仍然是個大問題。晶元的編程要考慮選擇哪一個神經元來連接，以及神經元之間相互影響的程度。比方說，為了識別上述視頻中的汽車，編程人員首先要對晶元的模擬版進行必要的設置，然後再傳給實際的晶元。這種晶元需要顛覆以往傳統的編程思想，盡管 IBM 去年已經發布了一套工具，但是目前編程仍非常困難，IBM 團隊正在編制令該過程簡單一點的開發庫。（當然，如果我們回顧過去編程語言從匯編一路走來的歷史，這一點也許不會成為問題。）
其次，在部分專業人士看來，這種晶元的能力仍有待證實。
再者，真正的認知計算應該能從經驗中學習，尋找關聯，提出假設，記憶，並基於結果學習，而IBM 的演示里所有學習（training）都是在線下的馮諾依曼計算機上進行的。不過目前大多數的機器學習都是離線進行的，因為學習經常需要對演算法進行調整，而 IBM 的硬體並不具備調整的靈活性，不擅長做這件事情。

三、人造神經元工作原理及電路實現
人工神經網路
人工神經網路（artificial neural network，縮寫ANN），簡稱神經網路（neural network，縮寫NN），是一種模仿生物神經網路的結構和功能的數學模型或計算模型。
神經網路是一種運算模型，由大量的節點（或稱「神經元」，或「單元」）和之間相互聯接構成。每個節點代表一種特定的輸出函數，稱為激勵函數（activation function）。每兩個節點間的連接都代表一個對於通過該連接信號的加權值，稱之為權重（weight），這相當於人工神經網路的記憶。網路的輸出則依網路的連接方式，權重值和激勵函數的不同而不同。而網路自身通常都是對自然界某種演算法或者函數的逼近，也可能是對一種邏輯策略的表達。Ref：Wikipedia：人工神經網路
電路原理
神經遞質的分泌反過來又是對動作電位刺激的反應。然而神經元在接收到這些神經遞質信號中的一個後便不會再繼續發出動作電位。當然，它們會逐漸累加至一個極限值。在神經元接受了一定數量的信號並超過極限值後----從根本上講是一個模擬進程----然後它們會發出一個動作電位，並自行重置。Spikey的人造神經元也是這么做的，當它們每次受到激發時都會在電容中累積電荷，直至達到限值，電容再進行放電。具體電路結構和分析之後有機會的話再更新。
現階段硬體的實現方式有數電（IBM、Qualcomm）、模電、數模混合（學界）、GPUs等等，還有各種不是基於硅半導體製程製作的神經元等的device方面的研究。

四、歷史
Neuromorphic engineering由老祖宗Carver Mead提出
卡福·米德是加州理工學院的一名工程師，被公認為神經形態計算機之父（當然還發明了「神經形態學」這個詞）
神經形態晶元的創意可以追溯到幾十年前。加州理工大學的退休教授、集成電路設計的傳奇人物卡弗·米德（Carver Mead）在1990年發表的一篇論文中首次提出了這個名稱。
這篇論文介紹了模擬晶元如何能夠模仿腦部神經元和突觸的電活動。所謂模擬晶元，其輸出是變化的，就像真實世界中發生的現象，這和數字晶元二進制、非開即關的性質不同。

後來這（大腦研究）成為我畢生的工作，我覺得我可以有所貢獻，我嘗試離開計算機行業而專注大腦研究。首先我去了MIT的人工智慧研究院，我想，我也想設計和製作聰明的機器，但我的想法是先研究大腦怎麼運作。而他們說，呃，你不需要這樣做，我們只需要計算機編程。而我說，不，你應該先研究大腦。他們說，呃，你錯了。而我說，不，你們錯了。最後我沒被錄取。但我真的有點失望，那時候年輕，但我再嘗試。幾年後再加州的Berkley，這次我嘗試去學習生物方面的研究。我開始攻讀生物物理博士課程。我在學習大腦了，而我想學理論。而他們說，不，你不可以學大腦的理論，這是不可以的，你不會拿到研究經費，而作為研究生，沒有經費是不可以的。我的天。
八卦：老師說neural network這個方向每20年火一次，之前有很長一段時間的沉寂期，甚至因為理論的不完善一度被認為是江湖術士的小把戲，申請研究經費都需要改課題名稱才能成功。（這段為小弟的道聽途說，請大家看過就忘。後來看相關的資料發現，這段歷史可能與2006年Geoffrey E. Hinton提出深度學習的概念這一革命性工作改變了之前的狀況有關。）

五、針對IBM這次的工作：
關於 SyNAPSE
美國國防部先進研究項目局的研究項目，由兩個大的group組成：IBM team和HRL Team。
Synapse在英文中是突觸的意思，而SyNAPSE是Systems of Neuromorphic Adaptive Plastic Scalable Electronics的簡稱。
Cognitive computing: Neurosynaptic chips
IBM proces first working chips modeled on the human brain
另一個SyNAPSE項目是由IBM阿爾馬登實驗室（位於聖何塞）的達爾門德拉·穆德哈負責。與四所美國大學（哥倫比亞大學，康奈爾大學，加州大學默塞德分校以及威斯康辛-麥迪遜大學）合作，穆德哈博士及其團隊製造了一台神經形態學計算機的原型機，擁有256個「積分觸發式」神經元，之所以這么叫是因為這些神經元將自己的輸入累加（即積分）直至達到閾值，然後發出一個信號後再自行重置。它們在這一點上與Spikey中的神經元類似，但是電子方面的細節卻有所不同，因為它們是由一個數字儲存器而非許多電容來記錄輸入信號的。
Ref: A million spiking-neuron integrated circuit with a scalable communication network and interface. Paul A. Merolla et al. Science 345, 668 (2014); DOI: 10.1126/science.1254642

㈥基於神經網路的圖像檢測具體該怎麼做

深刻

㈦卷積神經網路中用1*1 卷積有什麼作用或者好處

pooling理論在於，圖像中相鄰位置的像素是相關的。對一幅圖像每隔一行采樣，得到的結果依然能看。經過一層卷積以後，輸入的圖像尺寸變化不大，只是縮小了卷積核-1。根據相鄰數據的相關性，在每個nxn區域內，一般2x2，用一個數代表原來的4個數

㈧卷積神經網路測試圖像和訓練圖像大小要一樣嗎

這取決於你的卷積神經網路中是否存在全連接層，因為不同於全連接層，卷積神經網路中的參數是卷積核的權重，與輸入大小無關。如果是全卷積網路，那麼對於輸入的圖像解析度要求不高，可以大小隨意，不過多少應該會有影響。不過如果其中含有全連接層就需要保證輸入圖像大小一致，可以通過線性插值的方式進行放縮。

㈨數據集對卷積神經網路是體現什麼性能

卷積神經網路（Convolutional Neural Network,CNN）是一種前饋神經網路，它的人工神經元可以響應一部分覆蓋范圍內的周圍單元，對於大型圖像處理有出色表現。[1] 它包括卷積層(alternating convolutional layer)和池層(pooling layer)。
卷積神經網路是近年發展起來，並引起廣泛重視的一種高效識別方法。20世紀60年代，Hubel和Wiesel在研究貓腦皮層中用於局部敏感和方向選擇的神經元時發現其獨特的網路結構可以有效地降低反饋神經網路的復雜性，繼而提出了卷積神經網路（Convolutional Neural Networks-簡稱CNN）。現在，CNN已經成為眾多科學領域的研究熱點之一，特別是在模式分類領域，由於該網路避免了對圖像的復雜前期預處理，可以直接輸入原始圖像，因而得到了更為廣泛的應用。 K.Fukushima在1980年提出的新識別機是卷積神經網路的第一個實現網路。隨後，更多的科研工作者對該網路進行了改進。其中，具有代表性的研究成果是Alexander和Taylor提出的「改進認知機」，該方法綜合了各種改進方法的優點並避免了耗時的誤差反向傳播。

㈩神經網路的泛化能力差嗎

泛化能力，英文全稱generalization ability，指機器學習演算法對新鮮樣本的適應能力，一種預測新的input類別的能力。

通過學習找到隱含在數據背後的規律，並對具有同一規律的學習集以外的數據，這種經過訓練的網路可以給出合適的輸出，該能力就被稱為泛化能力。

對於神經網路而言，一般越復雜說明該神經網路承受的復雜度越高，描述規律的復雜度容量就越大，當然越好，當然也不是絕對的，但是這能說明一個容器容量的問題，這時該神經網路的泛化能力也越強。

我們需要知道結構復雜性和樣本復雜性、樣本質量、初始權值、學習時間等因素，都會影響神經網路的泛化能力。為了保證神經網路具有較強的泛化能力，人們已做了很多研究，得到了諸多泛化方法，常用的包括剪枝演算法、構造演算法和進化演算法等。

人工神經網路的泛化能力主要是由於透過無監督預學習可以從訓練集導出高效的特徵集。復雜的問題一旦轉換成用這些特徵表達的形式後就自然變簡單了。觀念上這個有點像是在做適用於訓練集的一種智能化的坐標轉換。

舉例來說，如果訓練集是許多人臉的圖片，那麼預訓練做得好的話就能導出如鼻子，眼睛，嘴巴，各種基本臉型等特徵。如果做分類時是用這些特徵去做而不是基於像素的話，結果自然會好得多。雖然大型的神經網路具有極多的參數，可是由於做分類時其實是基於少數的特徵，因此也比較不會產生過擬合的情形。

同時，針對神經網路易於陷入局部極值、結構難以確定和泛化能力較差的缺點，引入了能很好解決小樣本、非線性和高維數問題的支持向量回歸機來進行油氣田開發指標的預測。

閱讀全文

熱點內容

芝麻usdt怎麼轉賬發布：2025-07-13 22:55:03 瀏覽：746

男配只想C位出道doge 發布：2025-07-13 22:53:18 瀏覽：638

區塊鏈中國打擊嗎發布：2025-07-13 22:45:25 瀏覽：428

如何刪除eth鏈接發布：2025-07-13 22:43:19 瀏覽：456

國內最大的礦機是哪家發布：2025-07-13 22:37:21 瀏覽：213

trx董事長發布：2025-07-13 22:35:42 瀏覽：82

安妮區塊鏈下載發布：2025-07-13 22:01:55 瀏覽：433

注冊瑞波幣xrp新錢包發布：2025-07-13 22:01:49 瀏覽：228

區塊鏈好玩吧怎麼玩發布：2025-07-13 21:39:50 瀏覽：643

usdt一天可以買多少個發布：2025-07-13 21:38:43 瀏覽：761

圖像質量對神經網路算力的影響

與圖像質量對神經網路算力的影響相關的資訊