יש מה להשוות – חלק ה': כל השאר

במאמרים הקודמים בסדרה, ראינו כיצד ניתן להשוות את תכנם של מסמכים וגרסאות. סקרנו אפשרויות לסריקה של תיקיות שלמות (לדוגמה, למטרות סכנרון), והכרנו כלים – חינמיים, כאלה שעולים כסף, ואפילו כאלה שכבר מותקנים לנו על המחשב. נותרה לנו שאלה אחת בלתי פתורה: איך אני משווה בין קבצים כאשר אינני יודע אפילו מי הם והיכן הם נמצאים?

מקרה מבחן

נשמע מוזר? בואו נראה: לכולנו יש במחשב תיקיות ובהן תמונות – כאלה שהעברנו מהמצלמה הדיגיטלית, כאלה שהורדנו מהטלפון, תמונות שקיבלנו באימייל ושמרנו וגם כאלה שסרקנו מתוך אלבומים. לא פעם קורה שתמונה אחת מוצאת את דרכה אל מספר תיקיות. לדוגמה: הורדנו תמונה מהטלפון ושמרנו אותה בתיקיית התמונות הכללית שלנו; במקביל, הטלפון סנכרן אותה לתיקיית "תמונות מהטלפון" (אם יש לכם אייפון, לדוגמה, התיקיה נקראת "Photo Stream"); מתישהו החלטנו ליצור אלבום דיגיטלי, ולשם כך העתקנו תמונות מכל רחבי המחשב לתוך תיקיית האלבום החדש; על התמונות הללו עברנו עם פוטושופ, או תוכנת עריכה אחרת, כדי לתקן, להדגיש ולחתוך פרטים שונים – ואז שמרנו אותה כתמונה חדשה; בנוסף, החלטנו לגבות את המסגרת הדיגיטלית שלנו לתיקיה במחשב – ונחשו איזו תמונה גובתה עם כל השאר. בלי להתאמץ (ובלי לדעת אפילו), יש לנו כבר חמישה עותקים של אותה התמונה, מתוכם כמה שאינם זהים לשאר (אבל עדיין מבוססים על אותה התמונה).

מקרה אחר, פשוט יותר, נובע מהעתקת קבצים לתיקיות שונות – לפי קטגוריות (הברושור לטיול נשמר בתיקיית המסמכים הכללית, אבל גם בתיקיה שיצרנו במיוחד עבור הטיול) או אפילו כתוצאה מגיבוי (העתקנו את כל תיקיית המסמכים מהמחשב הישן לחדש כגיבוי – וביצענו גיבוי באופן הזה מספר פעמים).

בכל אחד מהמקרים הללו, יש לנו מחשב ובו קבצים (מסמכים, תמונות ועוד) כפולים ואף יותר, לעתים עם שינויים קטנים בין מסמך למסמך. אנחנו יכולים לעבור על כל התיקיות ולחפש קבצים עם שמות זהים, אבל לפעמים שם הקובץ משתנה במעבר בין התיקיות; לדוגמה: לתמונה שלנו קראו IMG1234.JPG במקור, אבל כשהעברנו אותה לתיקיית האלבום נתנו לה שם שמתאר את תוכנה, כמו "בחופשה באילת.jpg". למי יש כח לפתוח כל קובץ במחשב ולהשוותו לכל קובץ אחר?

השוואה כללית

לנו אולי אין כח, אבל למחשב יש. זוהי הרי תכונתם החזקה של מחשבים – לבצע עבודה סיזיפית בדייקנות, בלי להתלונן ומהר. קיימים כלים שונים להשוואה כללית של קבצים. מאחר שהם מבצעים משימות זהות, הם נראים דומים ואפילו השמות שלהם זהים כמעט. מתוכם אזכיר כאן את Fast Duplicate File Finder, את Easy Duplicate Finder ואת CloneSpy. כולן חינמיות (חלקן יבקשו מכם תרומה – אנא, היו נדיבים!) ומסוגלות לחפש קבצים דומים או זהים במקומות שונים. תנו להן רשימה של התיקיות או הכוננים, והן כבר יסתערו על הקבצים וימצאו את כל הכפילויות, בלי להתעצל ובלי להתבלבל.

הנה, לדוגמה, מסך בחירת התיקיות של Duplicate File Finder. נוסף על רשימת תיקיות בצד שמאל, תוכלו להגדיר בו גם את סוגי הקבצים בהם אתם רוצים להתמקד באמצעות ציון הסיומת שלהם (docx ,pdf וכו'), גדלים, תאריכים ואפילו מלים בשמות הקבצים:

מסך בחירת התיקיות וסוגי הקבצים של Duplicate File Finder (לחצו להגדלת התמונה)
מסך בחירת התיקיות וסוגי הקבצים של Duplicate File Finder (לחצו להגדלת התמונה)

לאחר הסריקה (שעלולה להימשך זמן רב – תלוי מה גודל התיקיות שהוריתם לתוכנה לסרוק), תקבלו רשימה של כל הקבצים הכפולים, עם אפשרות למחוק או להעביר את הקבצים המיותרים לתיקיה נפרדת. כך, לדוגמה, זה נראה ב-Easy Duplicate Finder (שימו לב לאפשרות לייצא את הרשימה עצמה לקובץ בצד הימני התחתון של המסך):

מסך תוצאות הסריקה של Easy Duplicate Finder (לחצו להגדלת התמונה)
מסך תוצאות הסריקה של Easy Duplicate Finder (לחצו להגדלת התמונה)

לכל תוכנה תכונות ייחודיות לה, ויש כמובן תוכנות רבות נוספות על אלה שהזכרתי. אתם מוזמנים לבדוק ולחלוק את רשמיכם.

השוואת תמונות

כפי שראינו בדוגמה הראשונה, תמונות מספקות כאב ראש מיוחד, מאחר שהן יכולות להכיל תוכן דומה למרות שהקבצים שלהן שונים למדי: שמירת תמונה בפורמט אחר (jpg במקום png, לדוגמה), תשנה לחלוטין את תוכן הקובץ, כמו גם את גודלו. עריכת תמונה – מחיתוך שוליים ועד לריטוש מעמיק בפוטושופ – תגרום לשינויים אחרים, למרות שצופה אנושי יוכל עדיין לזהות שמדובר באותה התמונה.

כאן נכנסות לתמונה (אופס!) תוכנות השוואת התמונות – הן דומות לתוכנות ההשוואה הכלליות ביכולתן לסרוק תיקיות שלמות, אך בנוסף הן מנתחות את תכני התמונות ומסוגלות לומר עד כמה שתי תמונות דומות או זהות. זיכרו, שמאחר שההשוואה הזו כוללת סריקה וניתוח מעמיק של תכני הקבצים, היא אורכת זמן רב – אחת התוכנות מתגאה בעובדה שהיא מסוגלת לסרוק תיקיה בגודל 15GB הכוללת 100,000 תמונות תוך שלוש שעות בלבד (!). קחו זאת בחשבון בבואכם לבצע את הפעולה.

גם בקטגוריה זו קיימות תוכנות רבות, מתוכן אציין את VisiPics, את Duplicate images finder ואת Awesome Duplicate Photo Finder. לאחר שתזינו רשימה של תיקיות לסריקה (ותמתינו בסבלנות רבה), תקבלו רשימה של תמונות דומות – וגם ציון של רמת הדמיון בין התמונות, מ-1% (מעט מאוד דמיון בין התמונות) ועד ל-100% (דמיון מלא, כלומר כפילות).

כך, לדוגמה, נראה המסך הראשי של Awesome Duplicate Photo Finder. שימו לב לרשימת התיקיות למעלה, לרשימת התמונות הדומות למטה, וכמובן – להשוואת התמונות במרכז, עם דמיון של 38%: אותו הבניין, רמת חשיפה שונה (הניחוש שלי: לפני ואחרי עריכה בפוטושופ).

השוואת תמונות דומות עם Awesome Duplicate Photo Finder (לחצו להגדלת התמונה)
השוואת תמונות דומות עם Awesome Duplicate Photo Finder (לחצו להגדלת התמונה)

לפעמים התוכנות הללו מעלות שאלות מעניינות.

שתי שקיעות, דומות אך לא זהות. מי מהן יפה יותר? את מי כדאי לשמור?
שתי שקיעות, דומות אך לא זהות. מי מהן יפה יותר? את מי כדאי לשמור?

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *