כיצד לחלץ טקסט או נתונים מתמונה

הועלה מחדש על ידי אפלטון

עוקב: 0

חילוץ טקסט מתמונה יכול להיות תהליך מסורבל. רוב האנשים מקפידים באופן ידני את הטקסט/נתונים מהתמונה; אבל זה גם גוזל זמן וגם לא יעיל כשיש לך הרבה תמונות להתמודד איתן.

ממירי תמונה לטקסט מציעים דרך מסודרת לחלץ טקסט מתמונות.

בעוד שכלים כאלה עושים עבודה טובה, הטקסט/הנתונים שחולצו מוצגים לעתים קרובות בצורה לא מובנית שמביאה להרבה עיבוד לאחר.

An OCR מונע בינה מלאכותית כמו Nanonets יכולים לשלוף טקסט מתמונות ולהציג את הנתונים שחולצו בצורה מסודרת, מאורגנת ומובנית.

Nanonets מחלץ נתונים מתמונות בצורה מדויקת, בקנה מידה ובמספר שפות. Nanonets הוא ה-OCR היחיד לזיהוי טקסט שמציג טקסט שחולץ בפורמטים מובנים בצורה מסודרת הניתנים להתאמה אישית לחלוטין. ניתן להציג נתונים שנלכדו כטבלאות, פריטי שורה או כל פורמט אחר.

לחץ כדי להעלות את התמונה שלך למטה
OCR של Nanonets מזהה אוטומטית את התוכן בקובץ שלך וממיר אותו לטקסט
הורד את הטקסט שחולץ כקובץ טקסט גולמי או שלב באמצעות API

תוכן העניינים

להלן שלוש שיטות מתקדמות בהן אתה יכול להשתמש ב-Nanonets OCR כדי לזהות ולחלץ טקסט מתמונות, לחלץ טקסט מ- PDFs, לחלץ נתונים מ- PDFשל או לנתח קובצי PDF וסוגי מסמכים אחרים:

חילוץ טקסט מתמונה באמצעות Nanonets

זקוק ל- OCR מקוון בחינם עבור תמונה לטקסט, PDF לשולחן, PDF לטקסט, או חילוץ נתוני PDF? בדוק את Nanonets באינטרנט ממשק API של OCR בפעולה והתחל לבנות דגמי OCR מותאמים אישית בחינם!

ל- Nanonets יש דגמי OCR מאומנים מראש עבור סוגי התמונות הספציפיים המפורטים להלן. כל מודל OCR מאומן מראש מאומן לקשור במדויק טקסט בסוג התמונה לשדה מתאים כמו שם, כתובת, תאריך, תפוגה וכו' ולהציג את הטקסט שחולץ בצורה מסודרת ומאורגנת.

חשבוניות
תקבולים
רישיון נהיגה (ארה"ב)
דרכונים

ננונטים מקוון OCR ו- OCR API מקוון יש הרבה מעניינים להשתמש במקרים.

[תוכן מוטבע]

ננונטים מחלצות טקסט מתמונות של קבלות

שלב 1: בחר מודל OCR מתאים

התחברות ל- Nanonets ובחרו מודל OCR שמתאים לתמונה ממנה רוצים לחלץ טקסט ונתונים. אם אף אחד מדגמי ה-OCR שהוכשרו מראש לא מתאים לדרישות שלך, תוכל לדלג קדימה כדי לגלות כיצד ליצור מודל OCR מותאם אישית.

שלב 2: הוסף קבצים

הוסף את הקבצים/התמונות מהם ברצונך לחלץ טקסט. אתה יכול להוסיף כמה תמונות שתרצה.

3 שלב: מבחן

אפשר כמה שניות לדגם לרוץ ולחלץ טקסט מהתמונה.

שלב 4: אמת

אמת במהירות את הטקסט שחולץ מכל קובץ, על ידי בדיקת תצוגת הטבלה בצד ימין. אתה יכול בקלות לבדוק שוב אם הטקסט זוהה בצורה נכונה והותאם לשדה או תג מתאים.

אתה אפילו יכול לבחור לערוך/לתקן את ערכי השדות והתוויות בשלב זה. Nanonets אינו מחויב לתבנית של התמונה.

ניתן להציג את הנתונים שחולצו בפורמט "תצוגת רשימה" או "JSON".

כיצד לחלץ טקסט או נתונים מ-PlatoBlockchain Data Intelligence. חיפוש אנכי. איי. — הטקסט שחולץ מוצג כפלט של רשימה או JSON

אתה יכול לסמן את תיבת הסימון לצד כל ערך או שדה שאתה מאמת או ללחוץ על "אמת נתונים" כדי להמשיך באופן מיידי.

שלב 5: ייצא

לאחר שכל הקבצים אומתו. ניתן לייצא את הנתונים המסודרים בקפידה כקובץ xml, xlsx או csv.

לננון יש מעניין להשתמש במקרים וייחודי סיפורי הצלחה של לקוחות. גלה כיצד Nanonets יכולה לגרום לעסק שלך להיות פרודוקטיבי יותר.

קל לבנות מודל OCR מותאם אישית עם Nanonets. בדרך כלל אתה יכול לבנות, לאמן ולפרוס מודל עבור כל סוג תמונה או מסמך, בכל שפה, הכל תוך פחות מ-25 דקות (בהתאם למספר הקבצים המשמשים לאימון המודל).

צפה בסרטון למטה כדי לבצע את 4 השלבים הראשונים בשיטה זו:

[תוכן מוטבע]

כיצד לאמן מודל OCR משלך עם Nanonets

שלב 1: צור מודל OCR משלך

התחברות אל Nanonets ולחץ על "צור דגם OCR משלך".

שלב 2: העלאת קבצי / תמונות אימון

העלה קבצי דוגמה שישמשו להכשרת דגמי ה- OCR. הדיוק של מודל ה- OCR שאתה בונה יהיה תלוי במידה רבה באיכות ובכמות הקבצים / תמונות שהועלו בשלב זה

שלב 3: הערת טקסט בקבצים / בתמונות

כעת הוסף הערה לכל פיסת טקסט או נתונים עם שדה או תווית מתאימים. שלב מכריע זה ילמד את מודל ה- OCR שלך לחלץ את הטקסט המתאים מתמונות ולשייך אותו לשדות מותאמים אישית הרלוונטיים לצרכים שלך.

אתה יכול גם להוסיף תווית חדשה כדי להוסיף הערות לטקסט או לנתונים. זכור, Nanonets אינו מחויב לתבנית של התמונה!

שלב 4: הרכבת דגם ה- OCR המותאם אישית

לאחר השלמת ההערה לכל קבצי האימון / תמונות, לחץ על "רכבת דגם". האימון נמשך בדרך כלל בין 20 דקות לשעה, תלוי במספר הקבצים ובמודלים בתור לאימונים. אתה יכול שדרוג לתוכנית בתשלום כדי להשיג תוצאות מהירות יותר בשלב זה (בדרך כלל פחות מ -20 דקות).

Nanonets ממנפת למידה עמוקה לבניית מודלים שונים של OCR ובודקת אותם זה מול זה לצורך דיוק. לאחר מכן, Nanonets בוחרת את מודל ה-OCR הטוב ביותר (בהתבסס על התשומות ורמות הדיוק שלך).

הכרטיסייה "מדדי מודל" מציגה את המדידות והניתוחים ההשוואתיים השונים שאפשרו ל- Nanonets לבחור את מודל ה- OCR הטוב ביותר מבין כל אלה שנבנו. באפשרותך להכשיר מחדש את המודל (על ידי מתן מגוון רחב יותר של תמונות אימון והערות טובות יותר) כדי להשיג רמות דיוק גבוהות יותר.

לחלופין, אם אתה מרוצה מהדיוק, לחץ על "בדוק" כדי לבדוק ולוודא האם דגם OCR מותאם אישית זה מבצע כצפוי במדגם של תמונות או קבצים שמהם יש לחלץ טקסט / נתונים.

שלב 5: בדוק ואמת נתונים

הוסף כמה תמונות לדוגמה כדי לבדוק ולאמת את דגם ה- OCR המותאם אישית.

ודא את הדיוק של הטקסט שחולץ — בדוק ואמת את דיוק הטקסט שחולץ

אם הטקסט זוהה, חולץ והוצג כראוי, ייצא את הקובץ. כפי שניתן לראות להלן, הנתונים שחולצו אורגנו והוצגו בפורמט מסודר.

מזל טוב, עכשיו בנית ואימנת מודל OCR מותאם אישית כדי לחלץ טקסט מסוגים מסוימים של תמונות!

האם העסק שלך עוסק בזיהוי טקסט במסמכים דיגיטליים, תמונות או קבצי PDF? האם תהיתם כיצד לחלץ טקסט מתמונות בצורה מדויקת?

אימון דגמי OCR משלך עם NanoNets API

הנה מדריך מפורט לאימון דגמי OCR משלך באמצעות ממשק API של Nanonets. ב תיעוד, תוכלו למצוא דגימות קוד מוכן לירות ב- Python, Shell, Ruby, Golang, Java ו- C#, כמו גם מפרט API מפורט לנקודות קצה שונות.

להלן מדריך שלב אחר שלב לאימון מודל משלך באמצעות Nanonets API:

שלב 1: שבט את הריפו

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

שלב 2: השג את מפתח ה- API החינמי שלך

השג את מפתח ה- API שלך בחינם https://app.nanonets.com/#/keys

שלב 3: הגדר את מפתח ה- API כמשתנה לסביבה

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

שלב 4: צור דגם חדש

python ./code/create-model.py

הערה: זה מייצר MODEL_ID הדרוש לך לשלב הבא

שלב 5: הוסף מזהה מודל כמשתנה לסביבה

export NANONETS_MODEL_ID=YOUR_MODEL_ID

שלב 6: העלה את נתוני ההדרכה

אסוף את תמונות האובייקט שברצונך לאתר. ברגע שיש לך נתונים מוכנים בתיקיה images (קבצי תמונות), התחל להעלות את מערך הנתונים.

python ./code/upload-training.py

שלב 7: דגם הרכבת

לאחר העלאת התמונות, התחל לאמן את הדגם

python ./code/train-model.py

שלב 8: קבל מצב דגם

הדגם לוקח ~ 30 דקות לאימון. תקבל דוא"ל ברגע שהמודל יוכשר. בינתיים אתה בודק את מצב הדגם

watch -n 100 python ./code/model-state.py

שלב 9: עשה חיזוי

ברגע שהמודל מאומן. אתה יכול לבצע תחזיות באמצעות המודל

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

היתרונות של שימוש בננונטים על פני ממשקי API אחרים של OCR חורגים רק מרמת דיוק טובה יותר ביחס לחילוץ טקסט מתמונות. להלן 7 סיבות מדוע כדאי לשקול להשתמש ב- Nanonets OCR לזיהוי טקסט במקום זאת:

1. עבודה עם נתונים מותאמים אישית

רוב תוכנות ה-OCR נוקשות למדי בסוג הנתונים שאיתם הם יכולים לעבוד. הכשרת מודל OCR למקרה שימוש דורש מידה רבה של גמישות ביחס לדרישותיו ולמפרטיו; OCR עבור עיבוד חשבוניות יהיה שונה מאוד מ-OCR עבור דרכונים! ננונטים אינם כבולים למגבלות כה נוקשות. Nanonets משתמשת בנתונים שלך כדי להכשיר מודלים של OCR המתאימים ביותר לענות על הצרכים המיוחדים של העסק שלך.

2. עבודה עם לא אנגלית או עם מספר שפות

מאז Nanonets מתמקדת באימון עם נתונים מותאמים אישית, היא ממוקמת באופן ייחודי לבניית מודל OCR יחיד שיכול לחלץ טקסט מתמונות בכל שפה או שפות מרובות בו-זמנית.

3. לא דורש עיבוד לאחר

טקסט שחולץ באמצעות מודלים של OCR צריך להיות מובנה בצורה חכמה ומוצג בפורמט מובן; אחרת, זמן ומשאבים רבים מושקעים בארגון מחדש של הנתונים למידע משמעותי. בעוד שרוב כלי ה-OCR פשוט תופסים ומשליכים נתונים מתמונות, Nanonets מחלצת רק את הנתונים הרלוונטיים וממיינת אותם אוטומטית לשדות בעלי מבנה חכם, מה שמקל על הצפייה וההבנה.

4. לומד ברציפות

עסקים מתמודדים לעתים קרובות עם דרישות וצרכים המשתנים באופן דינמי. כדי להתגבר על מחסומים פוטנציאליים, Nanonets מאפשרת לך לאמן מחדש בקלות את הדגמים שלך עם נתונים חדשים. זה מאפשר למודל ה-OCR שלך להסתגל לשינויים בלתי צפויים.

5. מטפל באילוצי נתונים נפוצים בקלות

Nanonets ממנפת טכניקות AI, ML ו-Deep Learning כדי להתגבר על אילוצי נתונים נפוצים המשפיעים מאוד על זיהוי טקסט וחילוץ. Nanonets OCR יכול לזהות ולטפל בטקסט בכתב יד, תמונות של טקסט במספר שפות בו-זמנית, תמונות ברזולוציה נמוכה, תמונות עם גופנים חדשים או סתמיים וגדלים משתנים, תמונות עם טקסט מוצל, טקסט מוטה, טקסט אקראי לא מובנה, רעש תמונה, תמונות מטושטשות ועוד. ממשקי API מסורתיים של OCR פשוט אינם מצוידים לביצוע תחת אילוצים כאלה; הם דורשים נתונים ברמת נאמנות גבוהה מאוד, שאינה הנורמה בתרחישים של החיים האמיתיים.

6. לא דורש צוות מפתחים פנימי

אין צורך לדאוג לגבי העסקת מפתחים ורכישת כישרון כדי להתאים אישית את Nanonets API לדרישות העסקיות שלך. Nanonets נבנה לשילוב ללא בעיות. אתה יכול גם לשלב בקלות את Nanonets עם רוב תוכנות CRM, ERP או RPA.

7. התאמה אישית, התאמה אישית, התאמה אישית

אתה יכול ללכוד כמה שדות טקסט/נתונים שתרצה עם Nanonets OCR. אתה יכול אפילו לבנות כללי אימות מותאמים אישית שעובדים עבור הדרישות הספציפיות שלך לזיהוי טקסט ולחילוץ טקסט. Nanonets אינו מחויב כלל לתבנית של המסמך שלך. אתה יכול ללכוד נתונים בטבלאות או בפריטים או בכל פורמט אחר!

ל- Nanonets מקרי שימוש רבים שיכולים לייעל את הביצועים העסקיים שלך, לחסוך בעלויות ולהגדיל את הצמיחה. תגלה כיצד מקרי השימוש של Nanonets יכולים לחול על המוצר שלך.

או לבדוק ננונטים ממשק API של OCR בפעולה והתחל לבנות מנהג OCR דגמים בחינם!

עדכון יולי 2022: פוסט זה פורסם במקור ב אוקטובר 2020 ומאז עודכן באופן קבוע.

הנה שקופית מסכם את הממצאים במאמר זה. הנה גרסה חלופית של הפוסט הזה.

בול זמן: 17 ביולי 202218 ביולי 2022

בול זמן: יאן 30, 2023