Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

Cv2.Canny() کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا

تعارف

کنارے کا پتہ لگانا وہ چیز ہے جو ہم فطری طور پر کرتے ہیں، لیکن جب کمپیوٹرز کے لیے قواعد کی وضاحت کی بات آتی ہے تو یہ اتنا آسان نہیں ہوتا ہے۔ جب کہ مختلف طریقے وضع کیے گئے ہیں، راج کرنے کا طریقہ جان ایف کینی نے 1986 میں تیار کیا تھا۔، اور اسے مناسب طریقے سے کینی طریقہ کا نام دیا گیا ہے۔

یہ تیز، کافی مضبوط ہے، اور اس کی تکنیک کی قسم کے لیے یہ کام کر سکتا ہے اس کے بارے میں صرف بہترین کام کرتا ہے۔ گائیڈ کے اختتام تک، آپ کو معلوم ہو جائے گا کہ ویڈیوز پر ریئل ٹائم ایج ڈٹیکشن کو کیسے انجام دیا جائے، اور ان خطوط پر کچھ تیار کیا جائے:

کینی ایج کا پتہ لگانا

کینی کا طریقہ کیا ہے؟ یہ چار الگ الگ آپریشنز پر مشتمل ہے:

  • گاوسی ہموار کرنا
  • کمپیوٹنگ میلان
  • غیر زیادہ سے زیادہ دباؤ
  • ہسٹریسیس تھریشولڈنگ

گاوسی ہموار کرنا ان پٹ امیج کو "آئرن آؤٹ" کرنے اور شور کو نرم کرنے کے لیے پہلے قدم کے طور پر استعمال کیا جاتا ہے، جس سے حتمی آؤٹ پٹ زیادہ صاف ہو جاتا ہے۔

تصویری میلان کنارے کا پتہ لگانے کے لئے پہلے ایپلی کیشنز میں استعمال کیا گیا ہے. خاص طور پر، Sobel اور Scharr کے فلٹرز تصویری میلان پر انحصار کرتے ہیں۔ سوبل فلٹر دو گٹھلیوں تک ابلتا ہے (Gx اور Gy)، کہاں Gx افقی تبدیلیوں کا پتہ لگاتا ہے، جبکہ Gy عمودی تبدیلیوں کا پتہ لگاتا ہے:

G

x

=

[

-
1

0

+
1

-
2

0

+
2

-
1

0

+
1

]

G

y

=

[

-
1

-
2

-
1

0

0

0

+
1

+
2

+
1

]

جب آپ انہیں کسی تصویر پر سلائیڈ کرتے ہیں، تو وہ ہر ایک اپنی اپنی سمت میں لائنوں کو "پک اپ" (زور دیں) کریں گے۔ Scharr دانا مختلف اقدار کے ساتھ اسی طرح کام کرتے ہیں:

G

x

=

[

+
3

0

-
3

+
10

0

-
10

+
3

0

-
3

]

G

y

=

[

+
3

+
10

+
3

0

0

0

-
3

-
10

-
3

]

یہ فلٹرز، ایک بار تصویر کے ساتھ منسلک ہونے کے بعد، خصوصیت کے نقشے تیار کریں گے:

Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

تصویری کریڈٹ: Davidwkennedy

ان فیچر نقشوں کے لیے، آپ حساب کر سکتے ہیں۔ تدریجی وسعت اور تدریجی واقفیت - یعنی تبدیلی کتنی شدید ہے (کتنا امکان ہے کہ کوئی چیز ایک کنارے ہے) اور تبدیلی کس سمت اشارہ کر رہی ہے۔ چونکہ Gy عمودی تبدیلی (Y-gradient) کو ظاہر کرتا ہے، اور Gx افقی تبدیلی (X-gradient) کو ظاہر کرتا ہے - آپ صرف Pythagorean theorem کو لاگو کر کے طول و عرض کا حساب لگا سکتے ہیں، تاکہ "بائیں" سے بننے والے مثلث کا فرضی تصور حاصل کیا جا سکے۔ "صحیح" ہدایات:

$$
{G} ={sqrt {{{G} _{x}}^{2}+{{G} _{y}}^{2}}}
$$

وسعت اور واقفیت کا استعمال کرتے ہوئے، آپ ایک تصویر بنا سکتے ہیں جس کے کنارے کو نمایاں کیا گیا ہے:

Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

تصویری کریڈٹ: Davidwkennedy

تاہم – آپ دیکھ سکتے ہیں کہ اینٹوں کے ٹیکچر سے بھی کتنا شور آیا! تصویری میلان شور کے لیے بہت حساس ہوتے ہیں۔ یہی وجہ ہے کہ Sobel اور Scharr فلٹرز کو جزو کے طور پر استعمال کیا گیا تھا، لیکن کینی کے طریقہ کار میں یہ واحد طریقہ نہیں تھا۔ Gaussian smoothing یہاں بھی مدد کرتا ہے۔

غیر زیادہ سے زیادہ دباؤ

سوبل فلٹر کے ساتھ ایک قابل توجہ مسئلہ یہ ہے کہ کنارے واقعی واضح نہیں ہیں۔ ایسا نہیں ہے کہ کسی نے پنسل لے کر تصویر کی لکیر بنانے کے لیے لکیر کھینچی ہو۔ تصویروں میں عام طور پر کنارے اتنے واضح نہیں ہوتے ہیں، کیونکہ روشنی آہستہ آہستہ پھیل جاتی ہے۔ تاہم، ہم کناروں میں مشترکہ لائن تلاش کر سکتے ہیں، اور اس کے ارد گرد باقی پکسلز کو دبا سکتے ہیں، اس کے بجائے ایک صاف، پتلی علیحدگی کی لکیر حاصل کر سکتے ہیں۔ یہ غیر زیادہ سے زیادہ دباؤ کے طور پر جانا جاتا ہے! غیر زیادہ سے زیادہ پکسلز (جس سے ہم ان کا موازنہ ایک چھوٹے سے مقامی فیلڈ میں کر رہے ہیں، جیسے کہ 3×3 کرنل) دب جاتے ہیں۔ یہ تصور اس سے زیادہ کاموں پر لاگو ہوتا ہے، لیکن آئیے اسے فی الحال اس سیاق و سباق سے باندھ دیں۔

ہسٹریسیس تھریشولڈنگ

روشنی کے حالات، تصویر میں موجود مواد وغیرہ کی وجہ سے بہت سے غیر کناروں کو کناروں کے طور پر جانچا جا سکتا ہے اور امکان ہے کہ یہ مختلف وجوہات کی بناء پر یہ غلط اندازہ لگایا جا سکتا ہے - اس بات کا خودکار اندازہ لگانا مشکل ہے کہ کنارہ یقینی طور پر کیا ہے اور کیا ہے نہیں آپ حد بندی کر سکتے ہیں، اور صرف مضبوط کو شامل کر سکتے ہیں، یہ فرض کرتے ہوئے کہ "حقیقی" کنارے "جعلی" کناروں سے زیادہ شدید ہیں۔

تھریشولڈنگ معمول کے مطابق اسی طرح کام کرتی ہے - اگر میلان کم حد سے نیچے ہے، تو اسے ہٹا دیں (صفر اس سے باہر)، اور اگر یہ دی گئی سب سے اوپر کی حد سے اوپر ہے تو اسے رکھیں۔ لوئر باؤنڈ اور اپر باؤنڈ کے درمیان ہر چیز "گرے زون" میں ہے۔ اگر دہلیز کے درمیان کوئی کنارہ a سے جڑا ہوا ہے۔ حتمی کنارے (جو دہلیز سے اوپر ہیں) - انہیں کنارے بھی سمجھا جاتا ہے۔ اگر وہ منسلک نہیں ہیں، تو وہ ممکنہ طور پر غلط حسابی کنارے کے آرفیکیٹس ہیں۔

یہ ہسٹریسیس تھریشولڈنگ ہے! درحقیقت، یہ حتمی آؤٹ پٹ کو صاف کرنے اور جھوٹے کناروں کو ہٹانے میں مدد کرتا ہے، اس بات پر منحصر ہے کہ آپ غلط کنارے کے طور پر کیا درجہ بندی کرتے ہیں۔ اچھی حد کی قدریں تلاش کرنے کے لیے، آپ عام طور پر دہلیز کے لیے مختلف نچلی اور اوپری حدود کے ساتھ تجربہ کریں گے، یا ایک خودکار طریقہ استعمال کریں گے جیسے اوٹسو کا طریقہ یا مثلث کا طریقہ۔

آئیے ایک تصویر کو لوڈ کریں اور اسے گرے اسکیل کریں (کینی، بالکل اسی طرح جیسے Sobel/Scharr کو تصاویر کو گرے اسکیل کرنے کی ضرورت ہوتی ہے):

import cv2
import matplotlib.pyplot as plt

img = cv2.imread('finger.jpg', cv2.IMREAD_GRAYSCALE)
img_blur = cv2.GaussianBlur(img, (3,3), 0)

plt.imshow(img_blur, cmap='gray')

Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

انگلی کی کلوز اپ تصویر کنارے کا پتہ لگانے کے لیے ایک اچھی ٹیسٹنگ گراؤنڈ کے طور پر کام کرے گی - تصویر سے فنگر پرنٹ کو پہچاننا آسان نہیں ہے، لیکن ہم اس کا اندازہ لگا سکتے ہیں۔

cv2.Canny() کے ساتھ امیجز پر کنارے کا پتہ لگانا

اوپن سی وی کا استعمال کرتے ہوئے کینی کا الگورتھم لاگو کیا جا سکتا ہے۔ Canny() طریقہ:

cv2.Canny(input_img, lower_bound, upper_bound)

بہترین طرز عمل، صنعت کے لیے منظور شدہ معیارات، اور چیٹ شیٹ کے ساتھ Git سیکھنے کے لیے ہمارے ہینڈ آن، عملی گائیڈ کو دیکھیں۔ گوگلنگ گٹ کمانڈز کو روکیں اور اصل میں سیکھ یہ!

نچلے باؤنڈ اور اپر باؤنڈ کے درمیان صحیح توازن تلاش کرنا مشکل ہو سکتا ہے۔ اگر دونوں کم ہیں - آپ کے پاس کچھ کنارے ہوں گے۔ اگر نچلی حد کم ہے اور اوپری اونچی ہے - آپ کو شور ہوگا۔ اگر دونوں اونچے اور ایک دوسرے کے قریب ہیں - آپ کے پاس کچھ کنارے ہوں گے۔ صحیح جگہ میں حدود کے درمیان کافی فاصلہ ہے، اور وہ صحیح پیمانے پر ہیں۔ تجربہ!

ان پٹ امیج کو کینی طریقہ سے دھندلا کر دیا جائے گا، لیکن اکثر اوقات، آپ اسے دھندلا کرنے سے فائدہ اٹھائیں گے۔ اس سے پہلے یہ بھی اندر جاتا ہے. یہ طریقہ بقیہ آپریشنز سے گزرنے سے پہلے ان پٹ پر 5×5 گاوسی بلر کا اطلاق کرتا ہے، لیکن اس دھندلا پن کے باوجود، کچھ شور اب بھی اندر سے نکل سکتا ہے، اس لیے ہم نے تصویر کو الگورتھم میں فیڈ کرنے سے پہلے دھندلا کر دیا ہے:


edge = cv2.Canny(img_blur, 20, 30)

fig, ax = plt.subplots(1, 2, figsize=(18, 6), dpi=150)
ax[0].imshow(img, cmap='gray')
ax[1].imshow(edge, cmap='gray')

اس کے نتائج:

Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

کی اقدار۔ 20 اور 30 یہاں صوابدیدی نہیں ہیں - میں نے طریقہ کار کو مختلف پیرامیٹرز پر آزمایا ہے، اور ایک سیٹ کا انتخاب کیا ہے جس سے لگتا ہے کہ ایک اچھا نتیجہ نکلتا ہے۔ کیا ہم اسے خودکار کرنے کی کوشش کر سکتے ہیں؟

cv2.Canny() کے لیے خودکار حد بندی؟

کیا آپ حد کی قدروں کا ایک بہترین سیٹ تلاش کر سکتے ہیں؟ ہاں، لیکن یہ ہمیشہ کام نہیں کرتا۔ آپ کچھ اچھی قیمت کے لیے اپنا حساب خود بنا سکتے ہیں، اور پھر رینج کو a کے ساتھ ایڈجسٹ کر سکتے ہیں۔ sigma اس دہلیز کے ارد گرد:

lower_bound = (1-sigma)*threshold
upper_bound = (1+sigma)*threshold

جب sigmaکہتے ہیں، 0.33 - حد ہو جائے گا 0.66*threshold اور 1.33*thresholdاس کے ارد گرد ~1/3 رینج کی اجازت دیتا ہے۔ اگرچہ، تلاش threshold کیا زیادہ مشکل ہے. اوپن سی وی ہمیں اوٹسو کا طریقہ (بائی ماڈل امیجز کے لیے بہترین کام کرتا ہے) اور مثلث کا طریقہ فراہم کرتا ہے۔ آئیے ان دونوں کو آزماتے ہیں، ساتھ ہی تیسرے آپشن کے طور پر پکسل ویلیو کا ایک سادہ میڈین لیتے ہیں۔

otsu_thresh, _ = cv2.threshold(img_blur, 0, 255, cv2.THRESH_OTSU)
triangle_thresh, _ = cv2.threshold(img_blur, 0, 255, cv2.THRESH_TRIANGLE)
manual_thresh = np.median(img_blur)

def get_range(threshold, sigma=0.33):
    return (1-sigma) * threshold, (1+sigma) * threshold

otsu_thresh = get_range(otsu_thresh)
triangle_thresh = get_range(triangle_thresh)
manual_thresh = get_range(manual_thresh)

print(f"Otsu's Threshold: {otsu_thresh} nTriangle Threshold: {triangle_thresh} nManual Threshold: {manual_thresh}")

اس کے نتائج:

Otsu's Threshold: (70.35, 139.65) 
Triangle Threshold: (17.419999999999998, 34.58) 
Manual Threshold: (105.18999999999998, 208.81)

یہ بہت مختلف ہیں! ان اقدار سے جو ہم پہلے دیکھ چکے ہیں، ہم اندازہ لگا سکتے ہیں کہ مثلث کا طریقہ یہاں بہترین کام کر رہا ہے۔ دستی حد بہت زیادہ مطلع نہیں ہے، کیونکہ یہ صرف میڈین پکسل ویلیو لیتا ہے، اور اس کا اختتام ایک ہائی بیس تھریشولڈ ہوتا ہے جسے اس تصویر کے لیے ایک وسیع رینج میں مزید ضرب دیا جاتا ہے۔ اوٹسو کا طریقہ اس سے کم متاثر ہوتا ہے، لیکن اس کے باوجود نقصان اٹھاتا ہے۔

اگر ہم چلاتے ہیں۔ Canny() ان حد کی حدود کے ساتھ طریقہ:

edge_otsu = cv2.Canny(img_blur, *otsu_thresh)
edge_triangle = cv2.Canny(img_blur, *triangle_thresh)
edge_manual = cv2.Canny(img_blur, *manual_thresh)

fig, ax = plt.subplots(1, 3, figsize=(18, 6), dpi=150)
ax[0].imshow(edge_otsu, cmap='gray')
ax[1].imshow(edge_triangle, cmap='gray')
ax[2].imshow(edge_manual, cmap='gray')

نوٹ: فنکشن ایک سے زیادہ دلائل کی توقع کرتا ہے، اور ہماری حدیں ایک ہی ٹپل ہیں۔ ہم کر سکتے ہیں تباہی اس کے ساتھ سابقہ ​​لگا کر متعدد دلائل میں ٹیپل کریں۔ *. یہ فہرستوں اور سیٹوں پر بھی کام کرتا ہے، اور پروگرامی ذرائع سے انہیں حاصل کرنے کے بعد متعدد دلائل فراہم کرنے کا ایک بہترین طریقہ ہے۔

اس کے نتائج:

Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

مثلث کا طریقہ یہاں بہت اچھا کام کرتا ہے! یہ کوئی گارنٹی نہیں ہے کہ یہ دوسرے معاملات میں بھی اچھا کام کرے گا۔

cv2.Canny() کے ساتھ ویڈیوز پر ریئل ٹائم ایج کا پتہ لگانا

آخر میں، آئیے ریئل ٹائم میں ایک ویڈیو پر Canny edge detection کا اطلاق کریں! ہم پروسیس ہونے والی ویڈیو (ہر فریم جیسا کہ یہ ہو چکا ہے) کا استعمال کرتے ہوئے دکھائیں گے۔ cv2.imshow() جو فریم کے ساتھ ایک ونڈو دکھاتا ہے جسے ہم ڈسپلے کرنا چاہتے ہیں۔ اگرچہ، ہم ویڈیو کو ایک MP4 فائل میں بھی محفوظ کریں گے جس کا بعد میں معائنہ اور اشتراک کیا جا سکتا ہے۔

OpenCV کا استعمال کرتے ہوئے ویڈیو لوڈ کرنے کے لیے، ہم استعمال کرتے ہیں۔ VideoCapture() طریقہ اگر ہم اندر داخل ہوتے ہیں۔ 0 - یہ موجودہ ویب کیم سے ریکارڈ کرے گا، تاکہ آپ اپنے ویب کیم پر بھی کوڈ چلا سکیں! اگر آپ فائل کا نام پاس کرتے ہیں، تو یہ فائل لوڈ کرے گا:

def edge_detection_video(filename):
    cap = cv2.VideoCapture(filename)
    
    fourcc = cv2.VideoWriter_fourcc(*'MP4V')
    out = cv2.VideoWriter('output.mp4', fourcc, 30.0, (int(cap.get(3)), int(cap.get(4))), isColor=False)
    
    while cap.isOpened():
        (ret, frame) = cap.read()
        if ret == True:
            frame = cv2.GaussianBlur(frame, (3, 3), 0)
            frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
            edge = cv2.Canny(frame, 50, 100)
            out.write(edge)
            cv2.imshow('Edge detection', edge)
        else:
            break

        if cv2.waitKey(10) & 0xFF == ord('q'):
            break

    cap.release()
    out.release()
    cv2.destroyAllWindows()

edge_detection_video('secret_video.mp4')

۔ VideoWriter کئی پیرامیٹرز کو قبول کرتا ہے - آؤٹ پٹ فائل کا نام، فور سی سی (چار کوڈیک کوڈز، ویڈیو کو انکوڈ کرنے کے لیے استعمال ہونے والے کوڈیک کی نشاندہی کرتے ہوئے)، فریمریٹ اور ریزولوشن بطور ٹوپل۔ ویڈیو کا اندازہ لگانے یا اس کا سائز تبدیل نہ کرنے کے لیے - ہم نے اصل ویڈیو کی چوڑائی اور اونچائی کا استعمال کیا ہے، جو VideoCapture مثال جس میں خود ویڈیو کے بارے میں ڈیٹا ہوتا ہے، جیسے چوڑائی، اونچائی، فریموں کی کل تعداد وغیرہ۔

جب کیپچر کھولا جاتا ہے، ہم اس کے ساتھ اگلے فریم کو پڑھنے کی کوشش کرتے ہیں۔ cap.read()، جو نتیجہ کا کوڈ اور اگلا فریم لوٹاتا ہے۔ نتیجہ کوڈ ہے۔ True or False، اگلے فریم کی موجودگی یا اس کی کمی کی نشاندہی کرنا۔ صرف اس صورت میں جب کوئی فریم ہو، ہم اس پر مزید کارروائی کرنے کی کوشش کریں گے، ورنہ، ہم لوپ کو توڑ دیں گے۔ ہر درست فریم کے لیے، ہم اسے گاوسی بلر کے ذریعے چلاتے ہیں، اسے گرے اسکیل میں تبدیل کرتے ہیں، چلائیں cv2.Canny() اس پر اور استعمال کرکے لکھیں۔ VideoWriter ڈسک پر، اور استعمال کرتے ہوئے ڈسپلے کریں cv2.imshow() ایک لائیو دیکھنے کے لیے۔

آخر میں، ہم کیپچر اور ویڈیو رائٹر کو جاری کرتے ہیں، کیونکہ وہ دونوں ڈسک پر موجود فائلوں کے ساتھ کام کر رہے ہیں، اور تمام موجودہ ونڈوز کو تباہ کر دیتے ہیں۔

جب آپ a کے ساتھ طریقہ چلاتے ہیں۔ secret_video.mp4 ان پٹ - آپ کو ایک ونڈو پاپ اپ نظر آئے گا اور اس کے ختم ہونے کے بعد، آپ کی ورکنگ ڈائرکٹری میں ایک فائل:

Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

نتیجہ

اس گائیڈ میں، ہم نے اس بات پر ایک نظر ڈالی ہے کہ کینی ایج ڈٹیکشن کیسے کام کرتا ہے، اور اس کے اجزاء - گاوسی اسموتھنگ، سوبل فلٹرز اور امیج گریڈینٹ، نان میکس سپریشن اور ہسٹریسس تھریشولڈنگ۔ آخر میں، ہم نے خودکار حد کی حد کی تلاش کے لیے کینی ایج کا پتہ لگانے کے طریقے تلاش کیے ہیں cv2.Canny()، اور ویڈیو پر تکنیک کا استعمال کیا، ریئل ٹائم ایج کا پتہ لگانے اور نتائج کو ویڈیو فائل میں محفوظ کرنا۔

مزید جانا - کمپیوٹر وژن کے لیے عملی گہری تعلیم

آپ کی جستجو کرنے والی فطرت آپ کو مزید آگے بڑھنا چاہتی ہے؟ ہم اپنے کو چیک کرنے کی تجویز کرتے ہیں۔ کورس: "Python کے ساتھ کمپیوٹر وژن کے لیے عملی گہری تعلیم".

Cv2.Canny() PlatoBlockchain ڈیٹا انٹیلی جنس کے ساتھ ازگر میں اوپن سی وی ایج کا پتہ لگانا۔ عمودی تلاش۔ عی

ایک اور کمپیوٹر وژن کورس؟

ہم MNIST ہندسوں یا MNIST فیشن کی درجہ بندی نہیں کریں گے۔ انہوں نے بہت پہلے اپنے حصے کی خدمت کی۔ بہت سارے سیکھنے کے وسائل بنیادی ڈیٹاسیٹس اور بنیادی فن تعمیرات پر توجہ مرکوز کر رہے ہیں اس سے پہلے کہ جدید بلیک باکس فن تعمیر کو کارکردگی کا بوجھ اٹھانے دیا جائے۔

ہم توجہ مرکوز کرنا چاہتے ہیں۔ demystification, عملیی, افہام و تفہیم, انترجشتھان اور حقیقی منصوبوں. سیکھنا چاہتے ہیں۔ کس طرح کیا آپ فرق کر سکتے ہیں؟ ہم آپ کو ایک سفر پر لے جائیں گے جس طرح سے ہمارے دماغ چھاتی کے کینسر کے لیے ایک ریسرچ گریڈ ڈیپ لرننگ کلاسیفائر لکھنے سے لے کر گہرے سیکھنے کے نیٹ ورکس تک لے جائیں گے جو کہ "فریب" کرتے ہیں، عملی کام کے ذریعے آپ کو اصول اور تھیوری سکھاتے ہیں، کمپیوٹر وژن کو حل کرنے کے لیے گہری سیکھنے کا اطلاق کرنے میں ماہر بننے کا طریقہ اور اوزار۔

اندر کیاہے؟

  • بصارت کے پہلے اصول اور کمپیوٹر کو "دیکھنا" کیسے سکھایا جا سکتا ہے۔
  • کمپیوٹر وژن کے مختلف کام اور ایپلی کیشنز
  • تجارت کے اوزار جو آپ کے کام کو آسان بنائیں گے۔
  • کمپیوٹر وژن کے لیے ڈیٹاسیٹس کی تلاش، تخلیق اور استعمال
  • Convolutional Neural Networks کا نظریہ اور اطلاق
  • ڈیٹا سیٹس میں ڈومین شفٹ، شریک ہونے اور دیگر تعصبات کو ہینڈل کرنا
  • سیکھنے کو منتقل کریں اور دوسروں کے تربیتی وقت اور کمپیوٹیشنل وسائل کو اپنے فائدے کے لیے استعمال کریں۔
  • ایک جدید ترین چھاتی کے کینسر کی درجہ بندی کرنے والے کی تعمیر اور تربیت
  • مرکزی دھارے کے خیالات پر شکوک و شبہات کی صحت مند خوراک کو کیسے لاگو کیا جائے اور وسیع پیمانے پر اختیار کی جانے والی تکنیکوں کے مضمرات کو کیسے سمجھا جائے
  • T-SNE اور PCA کا استعمال کرتے ہوئے ConvNet کی "تصور کی جگہ" کا تصور کرنا
  • کیس اسٹڈیز کہ کمپنیاں بہتر نتائج حاصل کرنے کے لیے کمپیوٹر ویژن تکنیک کا استعمال کیسے کرتی ہیں۔
  • ماڈل کی مناسب تشخیص، اویکت جگہ کا تصور اور ماڈل کی توجہ کی نشاندہی کرنا
  • ڈومین ریسرچ کرنا، آپ کے اپنے ڈیٹا سیٹس پر کارروائی کرنا اور ماڈل ٹیسٹ قائم کرنا
  • جدید فن تعمیر، خیالات کی ترقی، انہیں کیا منفرد بناتا ہے اور انہیں کیسے نافذ کیا جائے
  • KerasCV – جدید ترین پائپ لائنز اور ماڈل بنانے کے لیے ایک WIP لائبریری
  • پیپرز کو کیسے پارس کریں اور پڑھیں اور خود ان پر عمل کریں۔
  • آپ کی درخواست پر منحصر ماڈلز کا انتخاب
  • آخر سے آخر تک مشین لرننگ پائپ لائن بنانا
  • تیز تر R-CNNs، RetinaNets، SSDs اور YOLO کے ساتھ آبجیکٹ کا پتہ لگانے پر زمین کی تزئین اور بصیرت
  • مثال اور سیمنٹک سیگمنٹیشن
  • YOLOv5 کے ساتھ ریئل ٹائم آبجیکٹ کی شناخت
  • YOLOv5 آبجیکٹ ڈیٹیکٹر کی تربیت
  • KerasNLP (صنعت کی طاقت WIP لائبریری) کا استعمال کرتے ہوئے ٹرانسفارمرز کے ساتھ کام کرنا
  • تصاویر کے کیپشن بنانے کے لیے ConvNets کے ساتھ ٹرانسفارمرز کو مربوط کرنا
  • DeepDream
  • کمپیوٹر ویژن کے لیے ڈیپ لرننگ ماڈل کی اصلاح

ٹائم اسٹیمپ:

سے زیادہ Stackabuse