RSS – חלק א'

אם הבטתם בעיון על העמוד שלפניכם (או על כל עמוד אחר באתר זה), ודאי גיליתם בצד תיבה שכותרתה "הרסס (RSS)". במאמר זה נדון ב-RSS, למה הוא כאן ולמה אולי זה יכול לעזור לכם בחיים.

נתחיל בפיסת מידע לא חשובה, אבל רלוונטית: RSS הוא ראשי-תיבות של Really Simple Syndication; בעברית, אומצה המלה שנשמעת כמו RSS – רסס (כמו זה שיוצרים גלי ים, או להבדיל רימון יד), או הרסס (לקבלת מצלול יותר מדויק). הבעיה היא שמכל ההסברים הללו עדיין אי אפשר להבין מה זה ומה עושים איתו. בשביל זה אנחנו כאן.

שפות אנושיות ושפות מחשביות

עמודים ברשת בנויים ב"שפה" בשם HTML. השפה הזו מכילה טקסט רגיל וסימונים מיוחדים המורים על אפקטים שונים. דפדפן (פיירפוקס, אינטרנט אקספלורר, כרום וכו') קורא את הטקסט, ובעזרת הסימנים המיוחדים יודע איך להציג אותו. לדוגמה, כדי להציג את הקטע הבא בדפדפן:

"זה היה חשוב, יותר מדי חשוב!", הוא אמר.
"אתה מבין? זה חשוב!"

המחשב צריך לקבל את הטקסט הבא ב-HTML:

"זה היה חשוב, <em>יותר מדי חשוב</em>!", הוא אמר.<br/>
"אתה מבין? <strong>זה חשוב</strong>!

את המלים "יותר מדי חשוב" סימנתי בתגיות מיוחדות בשם <em> (קיצור של emphasis, דגש). כפי שוודאי ניחשתם, הן גרמו למלים להופיע באותיות נטויות. ההוראה להשתמש באותיות עבות ניתנה באמצעות התגיות <strong> (חזק). מעבר השורה בוצע באמצעות התגית <br> (שבירה, או באנגלית break). תגיות נוספות קיימות כדי למקם תמונה בטקסט, כדי ליישר פסקה (או את העמוד כולו) לימין, לשמאל או למרכז, כדי לשנות את גודל האותיות ועוד. לכל מטרה עיצובית יש תגית.

התגיות שמספקת שפת HTML נועדו לעיצוב ויזואלי, על-מנת לספק לנו, הקוראים, חוויית קריאה נוחה. אבל יש עוד כאלה שקוראים את העמודים באינטרנט, ולהם קשה להסתדר עם הוראות עיצוב כאלה. למעשה, הם לא מסוגלים להבחין בין תוכן מאמר לבין הכותרת שלו, ולא מבינים שהמספרים ליד הכותרת באתר זה, לדוגמה, משמעותם תאריך הפרסום. הקוראים הללו הם מחשבים, והם ניגשים לאתרים מסיבות שונות: ישנם מחשבים שמחפשים עמודים כדי לשמור אותם ולהציע אותם לכל מי שיחפש אחריהם. חברות כמו גוגל מחזיקות עדרים שלמים של מחשבים, שכל תפקידם הוא לקרוא עמודים באינטרנט ולסווג אותם כדי להגיש אחר-כך למחפשים. כדי לתת תוצאות רלוונטיות, על המחשב המחפש לדעת לקרוא ולהבין את העמודים אליהם הגיע מבחינת המבנה שלהם.

סיבה אחרת לשלוח מחשב לקרוא דפים ברשת היא תוכנות שמחפשות מידע חדש באתר קיים. לדוגמה, בכל פעם שאני ניגש לאתר חדשות כמו ynet, רוב הכותרות שם כבר מוכרות לי ואני צריך לתור אחר כותרות חדשות ולצוד ידיעות שצצו מאז הפעם האחרונה שביקרתי באתר. תוכנת מחשב תוכל לעזור לי מאוד במשימה אם היא תדע איך מחלקים את כל התיבות הקטנות בעמוד הראשון של ynet למאמרים, ואיך מחליטים איזה מאמר פורסם מתי.

כאשר אתר מציע שירות RSS, הוא מייצר מדי פעם קובץ מיוחד ובו מידע שנוח למחשב לקרוא. אם תלחצו על הכפתור הכתום בצד, ליד הכותרת "הרסס", תוכלו גם אתם לקבל את הקובץ הזה ולקרוא אותו. הוא כתוב בשפה אמיתית – טוב, לפחות באופן חלקי:

RSS - ככה זה נראה מאחורי הקלעים
RSS - ככה זה נראה מאחורי הקלעים

הסתכלו, לדוגמה, על התגית title: יש לה תגית "סוגרת" תואמת בסוף השורה. ביניהן יש קישור לתגובות בעמוד. למעשה, לכל תגית ב-RSS (ובפורמט בשם XML עליו RSS מתבסס) יש תגית סוגרת שכזו. בעזרת התגיות הללו, מחשב שקורא את האתר באמצעות RSS יכול "להבין" מה המשמעות של כל חלק בו. לדוגמה, שם האתר הוא "בלחיצת כפתור", הקישור הראשי הוא http://www.tzurel.co.il, ויש גם שפה וגרסת תוכנה ועוד ועוד. לאחר המידע הכללי על האתר, יש מידע על מאמרים שפורסמו בו: המאמר האחרון שפורסם, נכון לרגע כתיבת מאמר זה, הוא "שמירה אוטומטית". ויש גם קישור אליו ואל ההערות שהשאירו מבקרים באתר, ואפילו המלל המלא של המאמר עצמו (תחת התגית content:encoded). בקיצור – כל מה שמחשב צריך כדי לעשות שימוש באתר.

עם המידע הזה, יכול המחשב הקורא לגשת לחלק העיקרי של מלאכתו. המחשבים בגוגל, לדוגמה, ישמרו את כתובת האתר ושמו, ועבור כל מאמר – את שם המאמר ואת תוכנו. עכשיו, אם מישהו יחפש מאמר על שמירה אוטומטית, גוגל תמצא את פרטי העמוד, תציע לו לגשת לעמוד הזה, ותשתמש במידע שצברה כדי להציג את הכותרת ואת התוכן:

הזנה אוטומטית

אבל זה לא הכל: תוכנות ליקוט, המציגות מידע מעודכן מאתרים, יכולות לבקר באתרים הללו, לברור את התוכן המעניין מבחינתן (כלומר, ההגדרות שנתן להן המשתמש באשר למה שמעניין אותו) ולהוריד אותו אליהן. עכשיו, יכול המשתמש לגשת למחשב ולקרוא רק את המאמרים המעודכנים ביותר בנושאים בהם בחר, במקום לגשת לאתר ולהתחיל לחפש בעצמו.

כיום, כל דפדפן יודע לשמור RSS של האתר אותו הוא מראה. המינוח הוא להירשם להזנות (feeds)  של האתר, או של ערוץ (channel) מסוים בו. השמירה נעשית בדרך-כלל לרשימת הסימניות (או המועדפים) של הדפדפן, אבל זו סימניה מיוחדת: אם ניגש לסימניה הזו, נקבל רשימה של כל הפריטים שהדפדפן קרא מהאתר. אינטרנט אקספלורר, לדוגמה, יציג את ההזנה כך:

הזנת RSS כפי שנשמרה באינטרנט אקספלורר (לחצו להגדלת התמונה)
הזנת RSS כפי שנשמרה באינטרנט אקספלורר (לחצו להגדלת התמונה)

 

קיימות תוכנות תוכנות ייעודיות לאיסוף עדכונים באמצעות RSS. בתוכנות הללו נשתמש כאשר נרצה לקבל את ההזנות באופן אוטומטי. לדוגמה, אם נרצה שהן תבקרנה במספר אתרים ותצגנה את כל המידע החדש במקום אחד. מקרה נוסף, ופופולרי למדי, הוא הרשמה לשירותי פודקאסטים: ישנם אנשים המפרסמים קטעים מוקלטים – אם אלו שירים חדשים שהם מוציאים, ראיונות או סתם פינה שבועית מהגיגי לבם. הדרך ה"ידנית" להגיע להקלטה חדשה היא לכוון את הדפדפן שלנו לאתר הרצוי, לבדוק האם התפרסמה הקלטה שעוד לא שמענו, ואז להוריד את הקובץ (בדרך-כלל בפרמט MP3). תוכנות RSS יכולות להיות מאוד שימושיות במקרה הזה: הן יבקרו מדי פעם באתר, יבדקו אם יש משהו חדש, ואם פורסמה הקלטה – הן ישמרו אותה על המחשב שלנו. כל שייוותר לנו הוא לשמוע אותה, או להעביר אותה לנגן הנייד שלנו כדי לשמוע אותה מאוחר יותר.

למעשה, RSS היא טכנולוגיה שמקרבת אותנו לחזון "העיתון האישי" – מידע ה"תפור" עלינו ועל תחומי העניין שלנו. לא עוד עיתון כבד שאת רובו בכלל לא נקרא, אלא תוכן שאנחנו בחרנו (לפי מקור, תחומי עניין ומילות מפתח) ושמעניין אותנו. העתיד כבר כאן (מזה למעלה מעשור), ואנחנו מוזמנים להצטרף אליו.

בחלק הבא של המאמר, נסקור שימושים נוספים ל-RSS ונדבר על תוכנות שיעזרו לנו במשימה.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *