این مقاله [۱] نوشته جان رایت [۲] و ترجمه حمید کشاورز است.
مقالهای در مجله انجمن ارتباطات فنی اینترکام[۳] این گونه ادعا کرده است که نمایهسازی رواج فراوان یافته (ست میزلین[۴]، احیاء نمایهسازی[۵]، فوریه ۲۰۰۵) و اینکه در این حوزه نوعی تحول در حال وقوع است. اما در همایش ماه مارس رایترز یو. ای[۶]. در نشست مربوط به ویژگیهای مایکروسافت لاگهرن[۷] اظهار شد که سیستم کمکی لاگهرن نمایهای نخواهد داشت زیرا «کسی از آن استفاده نمیکند». در همان همایش در ادامه بحث شرکت اپل[۸] اظهار داشت که موتور کمکی آینده آنها شبکههای ترادفی[۹] از واژهها را در بر خواهد داشت و نوعی نمایهسازی را در صفحه نمایش اضافه خواهد کرد. چه کسی درست میگوید؟ چه کسی به درستی گرایشهای آتی را پیشبینی میکند؟
سه رویکرد موجود
طبق نظر لایس کرپز[۱۰] که من با او در آلرس[۱۱] و مایکروسافت سالها پیش کار کردم “نمایهسازی نوعی هنر اسرارآمیز است که زمان آن هنوز فرا نرسیده است”. این هنر اسرارآمیز که در آن یک انسان موضوع و جای انبوهی از اطلاعاتی را مشخص میکند هنوز با خودکارسازی بطور کامل انجام نمیشود. برخی موتورهای جستجوی زبان طبیعی نتایج خوبی را فراهم میکنند و برخی از آنها نتایج بسیار درهم آمیختهای را ارائه میکنند. این نتایج برای افراد که میخواهند ترفندهای بازیابی بهترین نتایج از هر موتور جستجو را یاد بگیرند رو به بهبود است. اما موتورهای جستجوی زبان طبیعی تنها یک جنبه از جستجو را پوشش میدهند. چالشهای بسیاری وجود دارد که تنها بوسیله موتور جستجو رفع نمیشوند حال چه به خاطر استفاده از زبان استعارهآمیز باشد چه به خاطر شیوه نامگذاری یا سازماندهی مدرک یا چگونگی انجام جستجو. اگر ما صرفاٌ بر روی خودکارسازی در بازیابی اطلاعات تاکید کنیم چیزهایی از دست خواهند رفت. “دیگر اطلاعات ارزشمند قابل بازیابی نخواهد بود بلکه اطلاعاتی دارای ارزش خواهد بود که صرفاٌ قابل بازیابی باشند” (ریچارد اوانز[۱۲]، ۲۰۰۲). اگر ساختار اطلاعات با موتورهای جستجو به خوبی سازگار نباشد یا اگر کاربر از چگونگی کاربرد موتور جستجو آگاه نباشد جستجو دچار کمبودهایی خواهد بود و اطلاعات ارزشمند از نظر دور خواهند شد.
جستجوهای ساده مانند “راه میانبر برای تایپ خط تیره چیست؟” برای موتورهای جستجو مساله آفرینند اما برای مسائل پیچیدهتر موتورهای جستجوی زبان طبیعی دچار کمبود هستند. برای نمونه “چگونه میتوان ستونهای عمودی اکسل را به گونهای ثابت کرد که تکان نخورند و همه آنها بر روی هر صفحه چاپی ظاهر شوند؟”. جستجو برای یافتن پاسخ برای پرسشی پیچیده یک فرایند گام به گام است. کاربر در طی یک جستجوی پیچیده شیوههای جستجو را برای چندین بار تغییر میدهد. جستجویی مانند مورد اکسل شاید شروعی مثل تایپ واژهها یا اصطلاحاتی در کادر جستجو داشته باشد. “ستونها ثابت نمیشود چه کار دیگری را میتوانم انجام دهم؟” و دقیقاً در قسمت چه کار دیگری را میتوانم انجام دهم است که کاربر خواستار دیدن فهرستی از دیگر گروههای موضوعی، واژهها یا یک نمایه تحلیلی است.
مادامیکه یک جستجوی مروری[۱۳] گروههای موضوعی و یا نوعی تحلیل را ارائه کند اطلاعات برای کاربری که دچار کمبود واژه است غیر قابل بازیابی خواهد بود. نمایهها و فهرستهای تحلیلی از مطالب میتوانند گروههای موضوعی را فراهم کنند. در فرایند جستجو گاهی مرور نیز صورت میگیرد که موتورهای جستجوی زبان طبیعی آنها را پوشش نمیدهند یعنی زمانی که کاربر خواهان دانستن انواع دیگر، روشهای دیگر، ویژگیهای دیگر، زیرمجموعههای دیگر یا ایدههای دیگری است که به حل مساله یا دستیابی به اطلاعات بهتر به او کمک میکند.
با این پیشزمینه، چه کسی در پیشبینی آینده نمایهسازی درست میگوید؟ من میگویم هرسه. سن میزلین درست میگوید زیرا افرادی که تمایل به نمایهسازی دارند چه به صورت آزاد و چه به صورت درون سازمانی نیاز به دستهبندی، طبقهبندی و زبانهای سازگار را احساس میکنند چراکه شرکتها با این حقیقت مواجهند که دارای کتابخانههایی با اطلاعات بسیار زیاد برای کنترل و دسترسپذیرسازی هستند. تحلیل مایکروسافت از نمایههایشان درست است چراکه آنها نمایههای خوبی را در محصولاتشان برای سالها نگنجندهاند و به راستی هیچ کس از نمایه محصولات آنها استفاده نمیکند. کاربران آنها پذیرفتهاند که از این نمایهها زیاد انتظار نداشته باشند. و اپل نیز در دسترسپذیرسازی دوباره نوعی نمایهسازی درست میگوید زیرا دریافته است که کاربران برای دسترسی به اطلاعات راههای جایگزین را برمیگزینند. کاربران دارای سبکهای یادگیری، سبکهای جستجو و شیوههای تکراری متفاوتی در طی یک جستجو هستند.
همانگونه که گوردن میر[۱۴] از شرکت اپل میگوید موتور جستجوی کمکی اپل واقعاً خوب است (تمام متن، زبان طبیعی) اما برخی کاربران جستجوگران خوبی نیستند. برای آنهایی که از کارکرد جستجو استفاده نمیکنند نمایه برای ایجاد نوعی دسترسی جایگزین است. یک دلیل اصلی برای گنجاندن نمایه در نسخه جدید بر خلاف نسخه قدیمیتر از کمک اپل[۱۵] این است که ما راهحلی فنی برای ساخت نمایه بر اساس نشانههایی که طراحان آموزشی قرار دادهاند اضافه کردهایم که باعث میشود صفحات به هم مرتبط بسیار راحتتر با الگوی نشر پیوسته و میتنی بر اینترنت ما سازگاری پیدا کنند.
کاربران به غیر از سیستمهای مروری کمکی سرنخهای فیزیکی برای اطلاعات پیوسته ندارند. جستجو ناهماهنگ به نظر میرسد مخصوصاً اگر کاربر مجبور باشد پرسش واحدی را بعد از یک یا دو ماه دوباره تایپ کند. یادم میآید برای یافتن پاسخی به پرسش ستون اکسل بیش از یک بار تلاش کردهام و پاسخهایی که دریافت کردم هر بار متفاوت بود. هنگام جستجو من کمی آنها را متفاوت جستجو کردم و به همین دلیل نمیتوانم به خاطر بیاورم دقیقاً چه واژهای مرا به پاسخ اصلی راهنمایی کرد. من میدانم که پاسخم وجود دارد اما نمیتوانم دقیقاً آنرا پیدا کنم. چنین پیشبینیناپذیری[۱۶] یعنی این احساس که شما جستجو را به خوبی انجام نمیدهید جستجوی پرسشهای پیچیده غیر را قابل اتکا میسازد. فراهم ساختن ابزاری هدایت کننده مانند نمایه که همیشه در دسترس باشد به کاربر منبعی جایگزین را برای درخواست کمک فراهم میکند.
خدمت به تمامی کاربرانتان با استفاده از همه اطلاعات موجود به معنای استفاده از یک شیوه قدیمی دسترسی و ارتباط آن به اطلاعاتی است که شما هرگز ننوشتهاید. پیشبینی چگونگی ارتباط بین موضوعات در نمایه به معنای دستهبندی و طبقهبندی ماهیت دانشی است که شرکت شما اکنون و احتمالاً در آینده اشاعه میدهد.
مساله به موضوع[۱۷] ارتباط دارد
هنوز نیاز شدیدی به اختصاص «ابردادههای موضوعی»[۱۸] به انبوه مطالب وجود دارد. این ابردادهها مانند نمایه یا فهرستی از گروههای موضوعی قابل نمایش هستند یا اینکه در فیلدهای پنهان شده توسط یک موتور جستجو مورد استفاده قرار میگیرد. نمایه شاید در نسخه بعدی لانگهرن وجود نداشته باشد اما به شیوههای دیگری وجود خواهد داشت چراکه تحلیل انسانی را برای نظارت بر موضوع در بر دارد. جستجوی مطلب در بستر درست آن هدف غایی است و اگرچه ما به این هدف نزدیکیم هنوز بطور کامل بازیابی خودکار محتوا را بررسی نکردهایم. ما نتایج بسیاری را بازیابی میکنیم که نیاز ما را به موقع یا هنگامیکه شیوه جستجو را عوض میکنیم پاسخ نمیگویند. هنوز اطلاعات نایافتنی بسیاری وجود دارد. ابردادههای موضوعی سرنخهایی از مطالب را به دست میدهند.
در چندین همایش اخیری که من شرکت کردم بر طرحهای ابردادهای تاکید فراوانی شده است. یک شرکت که با آن قرارداد بستهام بیش از صد فیلد ابردادهای دارد که باید برای هر مدرک در اینترانتش پر شود. من فکر نمیکنم اختصاص اینهمه ابرداده به مطالب همه مشکلات را حل کند زیرا کارمندان آنهمه وقت و شرکتها آنهمه پول ندارند و خودکارسازی و موتورهای زبان طبیعی همه آنها را مرتفع نمیسازند زیرا در این صورت هم گوگل و همکلیپهای کاغذی گویا[۱۹] همیشه باید کار کنند.
آنچه من میبینم چرخهای از تلاش رو به عقب و جلوست زیرا افراد تشخیص میدهند که برای مسائلی که دارند اطلاعات خوبی وجود دارد. راهحلهای پیشنهادی بین تحلیل انسانی و خودکارسازی در جریان است زیرا شرکتها مشکلات موجود با کاربرد هر یک ازآنها را دریافتهاند.
به دلایل بسیاری توسعه دهندگان محتوا نمیخواهند برای اختصاص کلیدواژه به مدراک و پر کردن فیلدهای ابردادهای وقت بگذارند. هنگامیکه بی توجهی فردی به مقیاس سیستمهای کمکی میرسد شما چارهای جز خودکارسازی ندارید. این امر به معنای وجود نوعی گسست است وقتی که کاربر با کمبود واژه روبروست یا نوعی گسست موضوعی است هنگامیکه موتور جستجو به آن نپرداخته باشد.
مشکل به سبکهای یادگیری ارتباط دارد
یک سیستم خوب کمک به کاربر با افزودن کمی توضیح یا شناسایی الگو یا ساختارهای شبیه به نقشه که نشان دهنده جای اطلاعات هستند کاربر را در در پرسش آیندهاش توانمند میسازد. چنین رویکردی در ارتباط با یادگیری برای دفعه بعد چیزی است که ما باید به آن بپردازیم. برای مثال کاربری بار اول اطلاعات مورد نیازش را از طریق یک موتور جستجوی تمام متن پیدا میکند اما بار دوم اینگونه نیست زیرا ۹۰ نتیجه را بازیابی کرده و دست از کار میکشد. ما باید این تعداد را کم کنیم (با وزندهی[۲۰] خوب، ابرداده و کنترل واژگانی). اما ما همچنان میخواهیم تا برای کاربران نتایج دقیقتری ارائه کنیم .این کار را چگونه میتوانیم انجام دهیم؟ چگونه میتوانیم به آنها در تشخیص الگوی جستجو در گستره خاصی از اطلاعات کمک کنیم؟ ما با اختصاص ابرداده به شیوه دسترسی جایگزین و کم خطر میتوانیم این کار را انجام دهیم. ما شیوههای جالبی را برای انجام این کار در مشاغل خاصی شناسایی کردهایم: عبور کاربر از میان جاده تصمیمگیری، ارائه به شکل متناسب، آموزشهای اختصاصی . ما به برخی استانداردها دست یافتهایم که کاربر یاد میگیرد انتظار داشته باشد: نمایهها، فهرست مطالب، فهرست منابع یا موضوعات مرتبط. ما باید دریابیم چگونه میتوان شیوههای یادگیری را با توجه به بستر پرسش و بستر موضوع ارائه کنیم.
اگر ما از سیستم میخواهیم که توسعه یابد و چالشهایی مانند اطلاعات تغییریافته یا روزآمد را مرتفع سازد به ابردادههای موضوعی از جنبه موضوعی و توانایی پیشبینی از جنبه جستجو نیاز خواهیم داشت و این همان جایی است که مهارتهای نمایهسازی مطرح میشوند. تهیه اطلاعات موضوعی کنترل شده از ساخت نمایه فراتر رفته و و آنرا به چیزی مبدل میسازد که میتواند کارهای متفاوتی انجام دهد. برای مثال اگر همه موضوعات موجود در یک سیستم کمکی دارای ابرداده باشند مواجهه با نام محصول، شغل، نسخه و موضوع بطور خودکار نتایجی منطبق با آن ابردادهها را در بر خواهد داشت صرفنظر از اینکه موضوع در سطح منطقهای مطرح است یا در وب و صرفنظر از زمان روزآمد سازی آن. این امر نیاز به مجموعه بسیار کنترل شدهای از ابردادههای موضوعی و گسترشهای آتی آن دارد.
گسترش جهان نمایه
اولین گام در این نوع مجموعه زبان کنترل شده، تحلیل انواع مطالب، انواع پرسشها و ساخت واژگان کنترل شده است به گونهای که اطلاعات شما در همه مدارک از استاندارد برخوردار گردد. این امر شامل توسعه استاندرادها، کنترل اطلاعات در همه مدراک، بازنگری در جاهایی که برخی مطالب با ابردادههای بسیاری و برخی دیگر با ابردادههای ناکافی تحلیل شده باشند. این یک فعالیت انسانی است و مهارتهای نمایهسازی جزء ماهوی آن است. شما میتوانید از واژهیابهای خودکار برای نمونهگیری از محتوای موضوعی یک دانش بهرهبرداری کنید اما تحلیل نهایی هنوز به انسان نیازمند است و با نیازهای شرکت و کاربران هماهنگ است.
شما گاهی متوجه حوزههای موضوعی همپوشان میشوید که حتی به بحثهای اینترنتی کشانده میشود و اینکه یک موضوع میتواند به شیوههای متفاوت ارائه شود. اینجا زمانی است که کار ماهیتی سیاسی یا فرهنگی به خود میگیرد. کدام ساختار در جهان را ما واقعی تصور کنیم؟ هر چه به این پرسشها بیشتر برخورد میکنیم بیشتر نمایان میشوند زیرا هیچ دو انسانی یک مطلب را مثل هم ساختار نمیدهند. چگونه ساختار سازمانی شما با نوع تصور کاربر از مطلب شباهت دارد؟
جرج لوئیس برگس[۲۱] مدعی شد که یک دایرهالمعاف چینی یافته که در آن حیوانات به گروههای زیر تقسیم شده است:
الف. متعلق به امپراتور
ب. مومیایی شده
پ. اهلی
ت. خوکهای خرطومدار
ث. زنان افسونگر
ج. اسطورهای
چ. سگهای ولگرد
ح. موجود در این طبقهبندی
خ. دیوانه
د. غیر قابل شمارش
ذ. نقاشی شده با یک برس خیلی خوب از موی شتر
ر. و غیره
ز. پارچ آب را تازه شکسته
ژ. آنهایی که از راه دور میآیند مثل مگسها
اولین واکنش ما در این باره تعجب است. ما در غرب به نوعی رویکرد دستهبندی شده و گونهشناختی از حیوانات عادت داریم. در مرحله بعد درخواهیم یافت که نوع طبقهبندی ما منبعث از فرهنگ ماست. برای فردی که این فهرست را تهیه کرده اینها گروههای حیوانی مهمی هستند. شیوهای که ما به عنوان توسعهدهندگان محتوا و نمایندگان محصولات یک شرکت مطالب را دستهبندی میکنیم نیز فرهنگی هستند و ما به عنوان نویسندگان و ویراستاران، فرهنگی کاملاً متفاوت از کاربرانمان داریم. باور ما از اینکه کمک به کاربر به چه میماند شاید این دستهبندی از حیوانات را به ذهن برخی از کاربرانمان متبادر کند. دستهبندی ما از مشاغل و مفاهیم شاید برای آنها هیچ مفهومی نداشته باشد و ابردادههای موضوعی ما باید دستهبندی آنها و نیز خود ما را منعکس سازد یا اینکه بپذیریم آنها در اطلاعات ما به نتیجه خوبی دست نیابند.
شما میتوانید این تفاوت فرهنگی بین طراح و کاربر را هنگام مشاهده رابطهای[۲۲] بد طراحی شده دریابید. هم رابطهای کاربری و هم رابطهای وب سایتها نمایی از فرهنگی هستند که به کاربرانی نمایش داده شدهاند که دارای زمینههای فرهنگی متفاوتی هستند. به یک شهروند سالخورده بیاندیشید که برای اولین بار با رایانه پسرش مواجه میشود و متعجب میماند که چرا در رایانه درایو سی وجود دارد ولی درایو بی. وجود ندارد. در وبسایتها گسست فرهنگی مشهودتر است. معماری اطلاعات وب سایت، مسائل سیاسی را نیز مطرح میکند. چه کسی بیشترین قدرت را در سازمان دارد تا مواد مربوط به مدیران را از نظر دور دارد. کاربران جزء فرهنگ سازمان نیستند و دیدگاه آنها از آنچه که باید در صفحه خانگی وبسایتها نمایش داده شود اغلب بخاطر مسائل سیاسی نادیده گرفته میشود. نقاط دسترسی جایگزین مانند نمایهها در وب سایتها معمولاً به چند دلیل به کار برده نمیشوند:
- کمبود ابزارهای کارآمد که انجام سریع، ساده، انعطافپذیر و روزآمدسازی فوری این کار را میسر میسازند
- کمبود نیروی کار ماهر
وب سایتها برای ساختن چیزی شیبه به نمایهها مدام در حال تغییر و روزآمدسازی هستند. پس اگر یک شرکت خواهان داشتن یک نمایه روی سایتش باشد باید یک واژگان کنترل شده تهیه کرده و آنرا در یک ابزار سهل الاستفاده گنجانده و برای اختصاص واژههایی به مثابه ابرداده برای هر صفحه تولید شده در سایت وقت بگذارد (میتوانید در یک زمان خاص توقف کنید: واژهها را در سطحی خاص تعریف کنید و بر جستجوی کوتاه برای مواردی که بسیار زود تغییر میکنند و یا صفحات پویای اینترنتی[۲۳] تمرکز کنید.
افزودن چنین اطلاعاتی به معنای مجبور کردن سازندگان محتوای سایتتان در ساخت فیلدهای خالی.و ساده ساختن کاربرد آن واژگان است. شرکت باید آن واژگان را با داشتن طرحی از رابط تولید کند: دانستن اینکه کاربر چه چیز را خواهد دید و کجا خواهد رفت. باید ابتدا رابط و سپس واژگان برای پرکردن آن ساخته شود. این کار به هماهنگی بسیاری نیاز دارد البته به میزان نگهداری واژگان نیز باید توجه شود. دلیل اینکه چرا نمایههای واقعی در وب وجود ندارند همین است. جستجو بسیار سادهتر است.
بازگشت نمایه
مقاله حاضر با بحث درباره نمایهسازی آغاز شد و متعاقباً با بحثهایی درباره طبقهبندیها و ابردادهها به پایان رسید. این خط سیر نمایهسازی است. نمایههای سنتی برای اطلاعات ثابتی که در محدودههای خاصی بودند بسیار کارگر بودند. اما محدودههای کمک به کاربر بسته نیستند و نمایهسازی ایستا هنگامیکه دانش شما در حال تغییر است دیگر به کار نمیآید. البته این به معنای منسوخ شدن نمایهسازی نیست بلکه به معنای تغییر شکل دادن و تبدیل شدن آن به واژگان کنترل شده یا ردهبندی یا ابردادههای موضوعی است. پارههایی از ساختارهای واژگانی بزرگتر را میتوان در قالب یک نمایه نمایش داد یا در کار یک موتور جستجو گنجاند و یا اینکه پیشبینی کرد که یک شرکت برای مدیریت محتوا به چه برچسبهایی نیاز دارد.
پس میتوان گفت مهارتهای نمایهسازی به دو دلیل همچنان حائز اهمیت هستند: ۱) تضمین اینکه کاربران شما شیوهای جایگزین برای دسترسی به اطلاعات دارند و ۲) تشخیص اینکه هنگامیکه اطلاعات با ابردادههای موضوعی نمایش داده شود دسترسپذیرتر میگردد. نمایهسازی هم کاربران و هم اطلاعات مهم شما را از گم شدن نجات میدهد.
نمایهها چه از بین بروند و چه باقی بمانند به مقدار آزاری که کاربران در هنگام جستجو تحمل میکنند و زمان و پولی که شرکتها برای دسترسپذیرسازی اطلاعات هزینه میکنند بستگی دارد. در حال حاضر گفتن آن دشوار است اما من نشانههایی را میبینم که دسترسی جایگزین در حال تحقق است. تا جایی که ما میدانیم بهتر این است که گزینههای مختلف مورد بررسی قرار گیرد. درباره استاندارسازی واژگان هرچه میتوانید بیاموزید، درباره رابطهایی که میخواهید به جای فهرستها و نمایهها قرار دهید فکر کنید، با حداقل ابرداده مدارک خود را نشانهگذاری کنید، به آنچه که دیگر شرکتها میکنند توجه کنید بویژه آنهایی که برای پیشرفت پول هزینه میکنند. اگر آنها در این رابطه به هزینه کردن پول بپردازند به خاطر این است که آزار کاربران در حال افزایش است.
[۱] . Available at: http://www.writersua.com/articles/indexing_future/
[۲] . Jan Wright
[۳] . Society for Technical Communications’ Intercom
[۴] . Seth Maislin
[۵] . The indexing revival
[۶] . WritersUA
[۷] . Microsoft’s Longhorn
[۸] . Apple
[۹] . Synonym rings
[۱۰] . Lise Kreps
[۱۱] . Aldus
[۱۲] . Richard Evans
[۱۳] . Browsing search
[۱۴] . Gordon Meyer
[۱۵] . Apple Help
[۱۶]. Unpredictability
[۱۷] . Aboutness
[۱۸] . Aboutness metadata
[۱۹] . Talking paper clip
[۲۰] . Weighting
[۲۱] . George Luis Borges
[۲۲] . Interfaces
[۲۳] . Active Server Pages: ASP