OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

OCR için Görüntü İşleme ve Sınırlama Kutuları

Teknoloji gelişmeye devam ediyor, biz de öyle. Yapay zeka ve makine öğreniminin ortaya çıkmasıyla birlikte odak noktası otomasyona kaydı. Bununla birlikte, ortaya çıkan bu eğilimlerin uygulamalarını incelemek ve keşfetmek için çeşitli bilgisayar bilimi disiplinleri tanıtılmaktadır.

Böyle bir örnek görüntü işleme. Basit bir dille, anlamlı bilgiler çizmek için görüntüleri keşfetmeyi ifade eder. Bunu başarmak için çeşitli teknikler mevcut olsa da, en yaygın olarak kullanılanı: sınırlayıcı kutular.

Bu blog, sınırlayıcı kutuların çeşitli yönlerini inceler. Ne olduklarını, görüntü işlemede nasıl çalıştıklarını, bunları tanımlayan parametreleri, bunları belirten kuralları, yaygın kullanım örneklerini, önlemleri ve en iyi uygulamaları ve daha fazlasını içerir.

Haydi içeri girelim.

Görüntü işleme, bir görüntü üzerinde ya onu geliştirmek ya da onunla ilişkili özelliklerden veya niteliklerden bazı değerli bilgiler çıkarmak için belirli işlemlerin yapılması anlamına gelir. Günümüzde görüntü işleme, mühendislik ve bilgisayar teknolojisi çalışmalarında birincil araştırma alanıdır.

Görüntü işleme iki yöntem kullanılarak yapılabilir - analog görüntü işleme ve dijital görüntü işleme.

Analog görüntü işleme, görüntüleri analiz etmek ve işlemek için çıktıların ve fotoğrafların basılı kopyalarını kullanmayı içerir. Görüntü analistleri, bu görüntü kopyalarını yorumlamak ve anlamlı sonuçlar çıkarmak için çeşitli yöntemler kullanır.

Dijital görüntü işleme, dijital görüntüleri kullanır ve bilgisayarları kullanarak bunları yorumlar. Dijital sinyal işlemenin bir alt kategorisidir ve dijital görüntüleri işlemek için algoritmalar kullanır. İşlemde gürültü ve bozulmayı önlemek için algoritmalar gibi analog görüntü işlemeye göre avantajlar sağlar.

Dijital görüntü işlemenin tıp, üretim, e-ticaret ve daha pek çok alanda çeşitli uygulamaları vardır.


Görüntü İşlemedeki Sınırlama Kutuları

Başlangıçta, sınırlayıcı kutu, bir nesne ve bir dizi veri noktası içeren hayali bir dikdörtgen kutudur. Sayısal görüntü işleme bağlamında, sınırlayıcı kutu, bir görüntüyü çevreleyen X ve Y eksenleri üzerindeki sınırın koordinatlarını belirtir. Bir hedefi tanımlamak ve nesne tespiti için referans olarak hizmet etmek ve nesne için bir çarpışma kutusu oluşturmak için kullanılırlar.

Sınırlayıcı Kutular Nedir?

Sınırlayıcı kutular, video açıklama projeleri için temel öğeler ve birincil görüntü işleme araçlarından biridir. Özünde, bir sınırlayıcı kutu, makine öğrenimi proje gereksiniminin bir parçası olarak bir görüntüdeki nesneyi ana hatlarıyla belirten hayali bir dikdörtgendir. Hayali dikdörtgen çerçeve, görüntüdeki nesneyi çevreler.

Sınırlayıcı kutular, nesnenin konumunu, sınıfını ve nesnenin sınırlayıcı kutuda gerçekten mevcut olma olasılığının derecesini söyleyen güveni belirtir.

Bilgisayarla görme, sürücüsüz arabalardan yüz tanımaya ve daha fazlasına kadar harika uygulamalar sunar. Bu da görüntü işleme ile mümkün olmaktadır.

Peki, görüntü işleme, nesnelerin etrafına dikdörtgenler veya desenler çizmek kadar basit mi? Hayır. Bununla birlikte, sınırlayıcı kutular ne işe yarar?

Anlayalım.

Sınırlama Kutuları Görüntü İşlemede Nasıl Çalışır?

Belirtildiği gibi, sınırlayıcı kutu, nesne tespiti için bir referans noktası görevi gören ve nesne için bir çarpışma kutusu geliştiren hayali bir dikdörtgendir.

Peki, veri açıklayıcılarına nasıl yardımcı olur? Profesyoneller, resimlerin üzerine hayali dikdörtgenler çizmek için sınırlayıcı kutular fikrini kullanırlar. Her görüntü içinde söz konusu nesnelerin ana hatlarını oluştururlar ve X ve Y koordinatlarını tanımlarlar. Bu, makine öğrenimi algoritmalarının işini kolaylaştırır, çarpışma yollarını bulmalarına yardımcı olur ve böylece bilgi işlem kaynaklarından tasarruf sağlar.

Örneğin, aşağıdaki resimde her araç, konumu ve konumu makine öğrenimi modellerini eğitmek için gerekli olan kilit bir nesnedir. Veri açıklayıcıları, bu nesnelerin her birinin (bu durumda araçlar) etrafına dikdörtgenler çizmek için sınırlayıcı kutular tekniğini kullanır.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: anahtarmakr

Ardından, makine öğrenimi modellerini eğitmek için yararlı olan her bir nesnenin konumunu ve konumunu anlamak için koordinatları kullanırlar. Tek bir sınırlayıcı kutu, iyi bir tahmin oranı sağlamaz. Gelişmiş nesne algılama için, veri büyütme yöntemleriyle birlikte birden çok sınırlayıcı kutu kullanılmalıdır.

Sınırlayıcı kutular, maliyetleri önemli ölçüde azaltan son derece verimli ve sağlam görüntü açıklama teknikleridir.

Bir Sınırlandırma Kutusu Tanımlayan Parametreler

Parametreler, sınırlayıcı kutuyu belirtmek için kullanılan kuralları temel alır. Kullanılan anahtar parametreler şunları içerir:

  • Sınıf: Sınırlayıcı kutunun içindeki nesneyi belirtir - örneğin, arabalar, evler, binalar vb.
  • (X1, Y1): Bu, dikdörtgenin sol üst köşesinin X ve Y koordinatlarını ifade eder.
  • (X2, Y2): Dikdörtgenin sağ alt köşesinin X ve Y koordinatlarını ifade eder.
  • (Xc, Yc): Bu, sınırlayıcı kutunun merkezinin X ve Y koordinatlarını ifade eder.
  • Genişlik: Bu, sınırlayıcı kutunun genişliğini belirtir.
  • Yükseklik: Bu, sınırlayıcı kutunun yüksekliğini belirtir.
  • Güven: Bu, nesnenin kutuda olma olasılığını temsil eder. Diyelim ki güven 0.9. Bu, nesnenin gerçekten kutunun içinde bulunma olasılığının %90 olduğu anlamına gelir.

Bir Sınırlandırma Kutusu Belirten Kurallar

Bir sınırlayıcı kutu belirtirken, genellikle iki ana kuralın dahil edilmesi gerekir. Bunlar:

  • Dikdörtgenin sol üst ve sağ alt noktalarının X ve Y koordinatları.
  • Genişliği ve yüksekliği ile birlikte sınırlayıcı kutunun merkezinin X ve Y koordinatları.

Bunu bir araba örneği ile açıklayalım.

a. Birinci kurala göre, sınırlayıcı kutu, sol üst ve sağ alt noktaların koordinatlarına göre belirlenir.

Kaynak: AnalitikVidhya

b. İkinci kurala göre, sınırlayıcı kutu merkez koordinatlarına, genişliğine ve yüksekliğine göre tanımlanır.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: AnalitikVidhya

Kullanım durumuna bağlı olarak, farklı kural türleri arasında dönüştürme yapmak mümkündür.

  • Xc = (X1 + X2)/2
  • Yc = (Y1 + Y2)/2
  • Genişlik = (X2 – X1)
  • Yükseklik = (Y2 – Y1)

Programlama Koduyla Açıklanan Sınırlama Kutuları

Kod parçacıkları içeren bir nesnenin konumu veya konumu hakkında başka bir örnek görelim.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

Bu çizim için kullanılacak görseli yüklüyoruz. Resimde solda bir köpek ve sağda bir kedi var. Görüntüde bir köpek ve bir kedi olmak üzere iki nesne var.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

Sınırlayıcı kutunun sol üst ve sağ alt köşeleri için x ve y'yi koordinat olarak alalım. (x1,y1) ve (x2,y2) deyin. Benzer şekilde, sınırlayıcı kutunun merkezi için (x,y) – eksen koordinatlarını genişlik ve yüksekliğiyle birlikte ele alalım.

Daha sonra, bu formları dönüştürmek için iki fonksiyon tanımlarız: box_corner_to_center iki köşeli gösterimi merkez-yükseklik-genişlik gösterimine dönüştürür ve box_center_to_corner tam tersini yapar.

Giriş argüman kutularının, iki boyutlu bir şekil tensörü (n,4) olması gerekir; burada n, sınırlayıcı kutuların sayısıdır.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

Ardından, koordinat verilerine göre resim üzerinde köpek ve kedinin sınırlayıcı kutularını tanımlayalım.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

İki sınırlayıcı kutu dönüştürme işlevinin doğruluğunu doğrulamak için iki kez dönüştürebiliriz.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

Ardından, doğru olup olmadıklarını kontrol etmek için görüntü üzerindeki nesnelerin sınırlayıcı kutularını çizebiliriz. Bundan önce, ilgili matplotlib paketi formatında sınırlayıcı kutuyu temsil eden bir bbox_t_rect işlevi tanımlıyoruz.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

Şimdi görüntüye köpek ve kedi nesnelerinin sınırlayıcı kutularını ekledikten sonra, bu nesnelerin ana hatlarının iki kutu içinde olduğunu görüyoruz.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: d2i


Tekrarlayan manuel görevleri otomatikleştirmek ister misiniz? Nanonets iş akışı tabanlı belge işleme yazılımımızı kontrol edin. Otomatik pilotta faturalardan, kimlik kartlarından veya herhangi bir belgeden veri ayıklayın!


Sınırlama Kutularının Ortak Kullanım Durumları

Otonom Araçların Nesne Lokalizasyonu

Sınırlayıcı kutular, binalar, trafik işaretleri, herhangi bir engel ve daha fazlası gibi yoldaki nesneleri tanımlamak için kendi kendini süren veya otonom araçların eğitiminde entegredir. Herhangi bir engele açıklama eklemeye yardımcı olur ve robotların aracı güvenli bir şekilde sürmesini ve tıkanıklık durumunda bile kazaları önlemesini sağlar.

Robotik Görüntü

Sınırlayıcı kutular gibi görüntü açıklama teknikleri, robotların ve dronların bakış açılarını işaretlemek için yaygın olarak kullanılmaktadır. Bu otonom araçlar, bu açıklama yönteminden elde edilen fotoğrafları kullanarak dünyadaki nesneleri sınıflandırmaya yardımcı oluyor.

E-Ticaret ve Perakende için resim etiketleme

Sınırlayıcı kutu ek açıklamaları, e-ticaret ve perakendede büyük bir artı olan ürün görselleştirmesini geliştirmeye yardımcı olur. Benzer öğeler üzerinde eğitilmiş modeller, uygun şekilde etiketlendiğinde moda giyim, aksesuar, mobilya, kozmetik vb. nesnelere daha kesin bir şekilde açıklama ekleyebilir. Perakendede sınırlayıcı kutu ek açıklamalarının ele aldığı bazı zorluklar aşağıda verilmiştir:

  • Yanlış Arama Sonuçları

Müşterilerin e-ticaret sitesine rastlamasının tek yolu arama yapmaksa, yanlış katalog verileri hatalı arama sonuçlarına neden olabilir ve böylece müşteri trafiğini siteye yönlendirmez.

  • Organize Olmayan Tedarik Zincirleri

Her yıl milyonlarca ürünün sevk edilebilmesi için perakende işlerini genişletmek isteyenler için, çevrimdışı ve çevrimiçi verilerin senkronize olması zorunlu hale geliyor.

  • Sürekli Sayısallaştırma

Müşterilerin yeni fırsatları kaçırmamalarını sağlamak için tüm ürünlerin sistematik ve hızlı bir şekilde dijitalleştirilmesi ve etiketlenmesi çok önemlidir. Ek olarak, etiketler bağlam içinde olmalıdır, perakende işi genişledikçe ve daha fazla ürün eklendikçe buna bağlı kalmak zorlaşır.

Sigorta Alacaklarında Araç Kaybını Tespit Eder

Kutuları sınırlama tekniği, bir kazada hasar görmüş arabaları, bisikletleri veya diğer araçları takip etmeye yardımcı olur. Makine öğrenimi modelleri, kayıpların konumunu ve yoğunluğunu anlamak için sınırlayıcı kutulardaki bu görüntüleri kullanır. Bu, müşterilerin dava açmadan önce tahminlerini sunabileceklerine bağlı olarak oluşan zararların maliyetini tahmin etmeye yardımcı olur.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: süper açıklama

İç Mekan Öğelerini Algılama

Sınırlayıcı kutular, bilgisayarların yataklar, kanepeler, masalar, dolaplar veya elektrikli aletler gibi iç mekan öğelerini algılamasına yardımcı olur. Bu, bilgisayarların boyutları ve konumları ile birlikte bir alan ve mevcut nesne türleri hakkında bir fikir edinmelerini sağlar. Bu da makine öğrenimi modellerinin bu öğeleri gerçek yaşam durumunda tanımlamasına yardımcı olur.

Sınırlayıcı kutular, çeşitli nesneleri anlamak ve yorumlamak için derin öğrenme aracı olarak fotoğraflarda yaygın olarak kullanılmaktadır.

Tarımda Hastalık ve Bitki Gelişimi Tanımlaması

Bitki hastalıklarının erken tespiti, çiftçilerin ciddi kayıpları önlemesine yardımcı olur. Akıllı çiftçiliğin ortaya çıkmasıyla birlikte, zorluk, bitki hastalıklarını tespit etmek için makine öğrenimi modellerini öğretmek için eğitim verileridir. Sınırlayıcı kutular, makinelere gerekli görüşü sağlayan önemli bir sürücüdür.

Üretim endüstrisi

Endüstrilerde nesne tespiti ve öğelerin tanımlanması, üretimin önemli bir yönüdür. Yapay zeka özellikli robotlar ve bilgisayarlar ile manuel müdahalenin rolü azalır. Bununla birlikte, sınırlayıcı kutular, endüstriyel bileşenleri bulmak ve algılamak için makine öğrenimi modellerinin eğitilmesine yardımcı olarak çok önemli bir rol oynar. Ayrıca kalite yönetiminin bir parçası olan kalite kontrol, tasnif ve montaj hattı operasyonları gibi süreçler de nesne tespiti gerektirir.

Tıbbi Görüntüleme

Sınırlayıcı kutular, tıbbi görüntüleme gibi sağlık sektöründe de uygulamalar bulur. Tıbbi görüntüleme tekniği, kalp gibi anatomik nesnelerin saptanmasıyla ilgilenir ve hızlı ve doğru analiz gerektirir. Sınırlayıcı kutular, daha sonra kalbi veya diğer organları hızlı ve doğru bir şekilde tespit edebilecek makine öğrenme modellerini eğitmek için kullanılabilir.

Otomatik CCTV'ler

Otomatik CCTV'ler çoğu konut, ticari ve diğer kuruluşlarda bir zorunluluktur. Genellikle, yakalanan CCTV görüntülerini uzun süre saklamak için yüksek bellek depolaması gerekir. Sınırlayıcı kutular gibi nesne algılama teknikleri ile yalnızca belirli nesneler tanımlandığında görüntünün kaydedilmesi sağlanabilir. Sınırlayıcı kutular, yalnızca bu nesneleri algılayacak olan makine öğrenimi modellerini eğitebilir ve o anda görüntüleri yakalayabilir. Bu aynı zamanda CCTV için gereken depolama kapsamını en aza indirmeye ve maliyetleri düşürmeye yardımcı olacaktır.

Yüz Tanıma ve Algılama

Yüz tanıma, biyometrik gözetimde kullanıldığı gibi birden fazla uygulama sunar. Ayrıca bankalar, havaalanları, perakende mağazaları, stadyumlar ve diğer kurumlar gibi çeşitli kurumlar suçları ve şiddeti önlemek için yüz tanıma özelliğini kullanır. Bununla birlikte, yüz algılama, görüntü işlemeyi içeren bilgisayarlı görmenin önemli bir unsurudur. Ve yine burada sınırlayıcı kutular karakter tanıma için etkili bir araç olarak kullanılabilir.


Robotik süreç otomasyonunu kullanmak ister misiniz? Nanonets iş akışı tabanlı belge işleme yazılımına göz atın. Kod yok. Zorluk platformu yok.


Karakter Tanıma İçin Sınırlama Kutuları

Nesne algılama şunları içerir: görüntü sınıflandırması ve nesne lokalizasyonu. Bu, bir bilgisayarın bir nesneyi algılaması için söz konusu nesnenin ne olduğunu ve nerede olduğunu bilmesi gerektiği anlamına gelir. Görüntü sınıflandırması, bir görüntüye bir sınıf etiketi atar. Nesne yerelleştirme, bir görüntüdeki söz konusu nesnenin çevresine sınırlayıcı kutunun çizilmesiyle ilgilidir.

İşlem, nesnelerin etrafındaki sınırlayıcı kutuları çizen ve bunları etiketleyen bir açıklayıcı içerir. Bu, algoritmayı eğitmeye yardımcı olur ve nesnenin neye benzediğini anlamasına izin verir. Nesne algılamanın ilk adımı olarak, görüntü veri kümesinin etiketleri olmalıdır.

Bir resmi etiketlemek için aşağıdaki adımları izleyin:

  • Eğitmek ve test etmek istediğiniz veri kümesini seçin. Ondan bir klasör yapın.
  • BTS, Avenger, vb. gibi bir yüz algılama projesi örneğini ele alalım.
  • Klasör adı verisi yapın.
  • Google Drive'da FaceDetection adında bir klasör oluşturun.
  • FaceDetection klasöründe görüntünün bir klasörünü oluşturun.
  • Görüntü klasöründe, test görüntüsünün klasörlerini oluşturun, XML'i test edin, görüntüyü eğitin ve XML eğitin.
OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak:endüstriyel

Şimdi, tren görüntü klasöründe, BTS ve Avengers'ın 10-15 görüntüsünü JPEG formatında indirin ve yükleyin. Benzer şekilde test image klasöründe de aynı işlemi 5-6 image için yapın. Doğru sonuçlar için veri kümesinde daha fazla görüntünün olması önerilir.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: endüstriyel

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: endüstriyel

Ardından, test görüntüsünün her görüntüsü için bir XML dosyası oluşturun ve görüntü klasörlerini eğitin

Windows v_1.8.0'ı indirin ve tıklayın. GitHub'dan .exe dosyasına tıklayın ve Çalıştır'a basın.

Ardından, görüntünün klasörünü seçmek için açık dizini tıklayın. Etiketlenmesi gereken resmi göreceksiniz. Etiketlemek için klavyede W tuşuna basın ve kutuyu nesnenin etrafına çizmek için imleci sağ tıklayın ve sürükleyin. Bir ad verin ve Tamam'ı tıklayın.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: endüstriyel

Ardından, aşağıda gösterildiği gibi görüntü klasöründeki görüntünün XML dosyasını oluşturmak için görüntüyü kaydedin.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: endüstriyel

Koordinatları görmek için XML dosyasını açın.

OCR PlatoBlockchain Veri Zekası için Görüntü İşleme ve Sınırlandırma Kutuları. Dikey Arama. Ai.

Kaynak: endüstriyel

XML dosyalarını oluşturmak ve koordinatları aramak için tüm görüntüler için prosedürü tekrarlayın.


Faturalar ve makbuzlarla çalışıyorsanız veya kimlik doğrulama konusunda endişeleniyorsanız, Nanonets'e göz atın çevrimiçi OCR or PDF metin çıkarıcı PDF belgelerinden metin çıkarmak için bedava. Hakkında daha fazla bilgi edinmek için aşağıya tıklayın Nanonets Kurumsal Otomasyon Çözümü.


Sınırlama Kutularında Kullanılan Çeşitli Açıklama Formatları

Esasen, bir sınırlayıcı kutunun köşeleri temsil eden (x,y) eksenlerinde 4 noktası vardır:

Sol üst : (x_min, y_min)

Sağ üst: (x_max, y_min)

Sol alt:(x_min, y_max)

Sağ alt: (x_max, y_max)

Sınırlayıcı kutunun koordinatları, görüntünün sol üst köşesine göre hesaplanır.

Her biri kendi sınırlayıcı kutu koordinatlarının temsilini kullanan birkaç sınırlayıcı kutu açıklama formatı vardır.

a. Albümmentasyonlar

Sınırlayıcı kutuyu temsil etmek için dört değer kullanırlar - [x_min, y_min, x_max, y_max] - x ekseni için piksel cinsinden koordinatların görüntünün genişliğine ve y ekseninin yüksekliğine bölünmesiyle normalleştirilir.

Sınırlayıcı kutunun koordinatlarının şöyle olduğunu söyleyin: x1 = 678, y1 = 24; x2 = 543, y2= 213.

Genişlik = 870, Yükseklik = 789 olsun

Ardından, [678/870, 24/789, 543/870, 213/789] = [ 0.779310, 0.030418 ,0.624137, 0.269961]

Albümmentasyonlar, bu değerleri dahili olarak sınırlayıcı kutularla kullanır ve yorumlar ve geliştirir.

b. koko

Bu, Context COCO veri setindeki Common Objects tarafından kullanılan bir formattır. COCO biçiminde, bir sınırlayıcı kutu dört değerle temsil edilir: (x_min, y_min, genişlik, yükseklik). Esasen, sol üst köşeye ve sınırlayıcı kutunun genişliğine ve yüksekliğine atıfta bulunurlar.

C. YOLO

Bu biçimde, dört değerle (x_center, y_center, width, height) bir sınırlayıcı kutu sunulur. Burada x_center ve y_center, sınırlayıcı kutunun merkezinin normalleştirilmiş x ve y koordinatlarını belirtir. Normalleştirmek için, görüntünün genişliğine göre merkezin x koordinatı ve görüntünün yüksekliğine göre merkezin y koordinatı. Genişlik ve yükseklik değerleri de normalleştirilir.

d. PASKAL

Pascal formatında, sınırlayıcı kutu sol üst ve sağ alt koordinatlarla temsil edilir. Dolayısıyla piksel cinsinden kodlanmış değerler: [x_min, y_min, x_max, y_max]. Burada [x_min, y_min] sol üst köşeninkidir, [x_max, y_max] ise sınırlayıcı kutunun sağ alt köşesini belirtir.


Tekrarlayan manuel görevleri otomatikleştirmek mi istiyorsunuz? Verimliliği artırırken Zamandan, Efordan ve Paradan Tasarruf Edin!


Sınırlama Kutularının Kullanımına İlişkin Önlemler ve En İyi Uygulamalar

Görüntü işlemede sınırlayıcı kutuların optimum kullanımı için bazı önlemler ve en iyi uygulamalar önerilir. Onlar içerir:

Kutu Boyutu Varyasyonları

Aynı boyuttaki tüm sınırlayıcı kutuların kullanılması doğru sonuçlar vermez. Modellerinizi aynı boyuttaki sınırlayıcı kutular üzerinde eğitmek, modelin daha kötü performans göstermesine neden olur. Örneğin, aynı nesne boyut olarak daha küçük görünüyorsa, model onu algılayamayabilir. Nesnelerin beklenenden daha büyük görünmesi durumunda, daha fazla sayıda piksel kaplayabilir ve nesnenin kesin konumunu ve konumunu sağlamayabilir. İşin püf noktası, istenen sonuçları elde etmek için nesnenin boyutundaki ve hacmindeki değişimi akılda tutmaktır.

Pixel-Mükemmel Sızdırmazlık

Sızdırmazlık çok önemli bir faktördür. Bu, doğru sonuçlar için sınırlayıcı kutunun kenarlarının söz konusu nesneye mümkün olduğunca yakın olması gerektiği anlamına gelir. Tutarlı boşluklar, modelin tahmini ile gerçek nesne arasındaki örtüşme alanının belirlenmesindeki doğruluğu etkileyebilir ve böylece sorunlar yaratabilir.

Sınırlama Kutularına Yerleştirilen Çapraz Öğeler

Sınırlayıcı bir kutuya çapraz olarak yerleştirilmiş öğelerle ilgili sorun, kutunun içinde arka plana kıyasla çok daha az yer kaplamalarıdır. Bununla birlikte, daha uzun süre maruz kalırsa model, daha fazla alan tükettiği için hedefin arka plan olduğunu varsayabilir. Bu nedenle, en iyi uygulama olarak, çapraz nesneler için çokgenler ve örnek segmentasyonu kullanılması önerilir. Yine de, iyi miktarda eğitim verisi içeren bir sınırlayıcı kutu ile modelleri öğretmek mümkündür.

Kutu Örtüşmesini Azalt

Tüm senaryolarda ek açıklama çakışmalarından kaçınmak her zaman güvenlidir. Bazen bu, o kadar fazla dağınıklığa neden olabilir ki, sonunda yalnızca üst üste binen bazı kutular görünebilir. Diğer varlıklarla örtüşen bir etiketlemeye sahip nesneler nispeten daha kötü sonuçlar üretir. Model, aşırı örtüşme nedeniyle hedef nesne ile diğer öğeler arasında ayrım yapamayacaktır. Bu gibi durumlarda, daha yüksek doğruluk için çokgenler kullanılabilir.

Sonuç

Görüntü işleme, geniş kapsam sunan gelişen bir teknoloji alanıdır. Bununla birlikte, sınırlayıcı kutular en yaygın olarak uygulanan görüntü işleme tekniğini oluşturur.

Özetlemek gerekirse, sınırlayıcı kutular, AI tabanlı makine öğrenimi modellerini eğitmek için bir görüntü açıklama yöntemidir. Robotlar, dronlar, otonom araçlar, gözetleme kameraları ve diğer yapay görme cihazları dahil olmak üzere çok çeşitli uygulamalarda nesne tespiti ve hedef tanıma için kullanılır.

Önerilen Kaynaklar:

https://www.kdnuggets.com/2022/07/bounding-box-deep-learning-future-video-annotation.html#:~:text=A%20bounding%20box%20is%20a,location%2C%20size%2C%20and%20orientation.

https://www.v7labs.com/blog/bounding-box-annotation

https://towardsdatascience.com/image-data-labelling-and-annotation-everything-you-need-to-know-86ede6c684b1


Nanonetler çevrimiçi OCR ve OCR API çok ilginç kullanım durumları tBu, iş performansınızı optimize edebilir, maliyetleri azaltabilir ve büyümeyi artırabilir. Bulmak Nanonetlerin kullanım durumlarının ürününüze nasıl uygulanabileceği.


Zaman Damgası:

Den fazla AI ve Makine Öğrenimi