刺激一区仑乱对白,女人被男人躁得好爽免费视频,欧美国产一区二区三区激情无套

服務近2000家企業(yè)，依托一系列實踐中打磨過的技術和產(chǎn)品，根據(jù)企業(yè)的具體業(yè)務問題和需求，針對性的提供各行業(yè)大數(shù)據(jù)解決方案。

三維網(wǎng)格物體識別技術
來源：未知　時間：2018-02-25　瀏覽次數(shù)：173次

二位平面物體識別技術在人工智能領域已經(jīng)很成熟，但三位立體物體識別技術并不成熟，有待研究

如何輸入3D 網(wǎng)格物體（原始三角形和頂點），得到分類概率的輸出。

我找到了如下幾種解決方案：

對物體進行縮放并將其分割成體素。將體素給到神經(jīng)網(wǎng)絡中。
計算大量描述符，將其放入分類器。
從多側(cè)進行物體投射，嘗試用單獨的分類器進行識別，然后將其放到元分類器中。

在這里我想詳細講述一下一種相對簡單有效的方法，即 DeepPano 方法。

數(shù)據(jù)準備

如今，圖像數(shù)據(jù)集包含大量樣本。但就 3D 模型數(shù)據(jù)集而言，并非如此。3D 模型數(shù)據(jù)集中沒有成千上萬的圖像，因此 3D 模型識別沒有得到深入研究，3D 模型數(shù)據(jù)集也不均衡。大多數(shù)數(shù)據(jù)集包含有未進行方向?qū)R的物體。

ModelNet10 是一個相對清晰的 3D 物體數(shù)據(jù)集。3D 物體在數(shù)據(jù)集中被存儲為包含點線面的 .off 文件。 .off 文件格式不支持顯示布料、紋理以及其他材質(zhì)。

這里是物體種類與樣本數(shù)量：

一文教會你三維網(wǎng)格物體識別

樣本總數(shù)約為 5000。當然這個數(shù)據(jù)集也非常不均衡。

首先要做的是選擇分類器類型。由于如圖像、語音等重要數(shù)據(jù)的技術解決方案都是基于神經(jīng)網(wǎng)絡（或在 Kaggle 比賽中經(jīng)常使用的奇特組件），因此訓練神經(jīng)網(wǎng)絡是合乎邏輯的。神經(jīng)網(wǎng)絡對數(shù)據(jù)集的均衡性很敏感。所以第二步需要做的是使數(shù)據(jù)集更均衡。

我決定使用從 3dWarehouse 中得到的模型獲取更多數(shù)據(jù)并創(chuàng)建擴展數(shù)據(jù)集。這些模型是以 .skp 文件格式存儲的，因此必須進行轉(zhuǎn)換。我使用 SketchUp C Api 創(chuàng)建了 .skp - >.off 轉(zhuǎn)換器來進行轉(zhuǎn)換。

下一步是數(shù)據(jù)清理，完全相同的圖像已被刪除?？梢赃@樣分配：

一文教會你三維網(wǎng)格物體識別

這樣數(shù)據(jù)集看起來就比較均衡了。除馬桶外，幾乎每個物體類別都包含有近1000個樣本。其他物體類型之間的不均衡可通過分類權重進行修正。

數(shù)據(jù)預處理

在之前的步驟中，我們已經(jīng)做了幾件重要的事情。

闡述問題。
下載我們將要使用的基本數(shù)據(jù)集（ModelNet10）。
從最初的10類物體中選出了7類。
通過創(chuàng)建.skp - > .off轉(zhuǎn)換器來轉(zhuǎn)換3d warehouse.中的模型，數(shù)據(jù)集變得更加均衡。

現(xiàn)在開始深入了解數(shù)據(jù)預處理。

在預處理過程中，數(shù)據(jù)預處理的最終結果是要用一種新的圖像來表示 3D 網(wǎng)格物體。我們將使用圓柱投影來創(chuàng)建圖像。

一文教會你三維網(wǎng)格物體識別

3D網(wǎng)格物體

一文教會你三維網(wǎng)格物體識別

此物體的轉(zhuǎn)換結果

首先，我們需要讀入3D 網(wǎng)格物體并進行存儲。這可以通過功能強大的 trimesh 庫來完成。它不僅提供讀/寫功能，而且有大量其他有用的功能，如網(wǎng)格變換，光線追蹤等。

第二步是計算圓柱投影。圓柱投影是什么呢？假設一個立方體位于 XoY 平面的中心，且原點有一條垂直軸。

注意：如果物體的主軸不垂直，則需要在進行物體識別前應用方向?qū)R算法。這是一個完全不同的領域，因此在這里不對此主題進行探討。

一文教會你三維網(wǎng)格物體識別

立方體和主軸

一文教會你三維網(wǎng)格物體識別

現(xiàn)在假設有一個包裹立方體的最小圓柱體。

一文教會你三維網(wǎng)格物體識別

現(xiàn)在將圓柱體的側(cè)面切割成M×N的網(wǎng)格。

一文教會你三維網(wǎng)格物體識別

現(xiàn)在將每個網(wǎng)格節(jié)點垂直投影到主軸上并獲取一組投影點。投影點集合由P表示。投影線集合由S表示。

綠色是主軸，紅色是網(wǎng)格，黃色是幾何投影線。

現(xiàn)在將S集合中的每段與網(wǎng)格體，即該立方體相交。你將從每條射線獲得一個交點。將該點分配給相應的網(wǎng)格節(jié)點。

其實這是一個特例。一般情況下，S中的一個投影線可以有多個交點，或者根本沒有交點。下面就是一個例子。

一文教會你三維網(wǎng)格物體識別

因此，通常這個過程的結果是在每個單元中都有一個 M×N 矩陣，其中可能具有交點數(shù)組，也可能是空的。對于立方體，每個單元格將包含具有單個元素的數(shù)組。

下一步是從每個單元格的交點中選取離對應的M中的點距離最遠的點，并將它們之間的距離寫入 M×N 矩陣R。矩陣（或圖像）R 稱為全景圖。

我們?yōu)槭裁匆x取最遠的點？最遠的點通常集中于物體的外表面。我們將其用全景圖表示，可用于識別模塊。當然，有人可能會說：“圓環(huán)和高度相同的圓柱體會呈現(xiàn)出完全相同的全景圖”或者“中心有一個球形孔的立方體和沒有孔的立方體會呈現(xiàn)出完全相同的全景圖”，這是正確的。以全景圖來呈現(xiàn)3D物體并不完美，但如果是用體素來呈現(xiàn)則沒有這樣的缺點。幸運的是，像椅子、床、汽車或飛機這些真實存在的物體由于其復雜性，很少有相同的全景圖。

最后一步是通過將單元格的值縮放到 [0,1] 區(qū)間，對R矩陣進行歸一化。如果單元格沒有交點，則該單元格的值為零。

現(xiàn)在我們可以將矩陣R視為灰度圖像。這里是所描述過程的 python 代碼和全景圖計算的一個例子。

一文教會你三維網(wǎng)格物體識別

混凝土床、椅子和馬桶的全景圖。

我們總結一下到目前為止已經(jīng)完成的步驟。

現(xiàn)在我們已經(jīng)將 3D 網(wǎng)格物體表示為灰度圖像。
3D 物體必須正確對齊。如果沒有正確對齊，那么我們首先需要使用方向?qū)R算法。
兩個不同的物體有可能具有相同的全景圖，但這種可能性很小。

現(xiàn)在我們準備創(chuàng)建卷積神經(jīng)網(wǎng)絡并解決識別問題。

開始識別！

我們在上一步中做了一件非常重要的事情，即找到一種合適的方法將3D物體轉(zhuǎn)換成圖像，我們可以將其提供給神經(jīng)網(wǎng)絡（NN）。

步驟如下所示：

一文教會你三維網(wǎng)格物體識別

我們之前已經(jīng)完成了第1步，所以現(xiàn)在我們開始第2步和第3步。

讓我們從模型創(chuàng)建開始。

你可以在架構中看到 RWMP 層。根據(jù) DeepPano 論文，RWMP 層的作用在于，在 3D 物體圍繞主軸旋轉(zhuǎn)的情況下，保持識別精度不變。從技術上講，RWMP 只是一個行式的 MaxPooling。

模型準備就緒并編譯完成后，讀取數(shù)據(jù)，然后將其刷新，并通過圖像尺寸調(diào)節(jié)創(chuàng)建 ImageDataGenerator。請注意，數(shù)據(jù)預先按照 70:15:15 的比例進行了訓練、驗證和測試。由于圖像是合成的，并且代表了3D 物體，因此數(shù)據(jù)無法進行擴增，因為：