مدیریت مستندات محتوای فارسی رسانه های آنلاین خبری در جامعه اطلاعاتی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه مدیریت فناوری اطلاعات، واحد تهران مرکزی، دانشگاه آزاد اسلامی

2 گروه مدیریت صنعتی، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.(نویسنده مسئول)

3 گروه مدیریت، پژوهشگاه علوم انتظامی و مطالعات اجتماعی، تهران، ایران.

چکیده

 
عصری که ما در آن زندگی می‌کنیم، عصر اطلاعات است و برای سازمان ها مهم‌ترین مسئله، اشراف بر همین اطلاعات است. با رشد روزافزون اخبار در دنیای دیجیتال و اینترنت، موضوعی که مهم و حائز اهمیت می‌شود، دسته‌بندی این اطلاعات و دسترسی سریع و ارزان ما به آن‌ها می‌باشد. این مهم به دست نمی‌آید مگر با انجام روش‌هایی که از آن به‌عنوان دسته‌بندی متون یاد شده است. هدف این پژوهش دسته­بندی متون خبری در دسته‌های‌ از قبل‌ مشخص‌شده می باشد که با استفاده از ابزار مدل اتوماتیک که یکی‌ از زیرمجموعه­های متن‌کاوی محسوب می‌شود صورت می پذیرد. با توجه‌ به‌ اهمیت‌ موضوع و کاری‌ که‌ در این‌ زمینه‌ برای‌ زبان‌های‌ دیگر دنیا انجام گرفته‌ است‌، نیاز به‌ طبقه‌بندی‌ متون فارسی‌ به‌ خوبی‌ احساس می‌شود. این نکته قابل توجه می باشد که تحقیقات برای متون انگلیسی توسعه داده شده و به کارگرفته می شود اما از آنجایی‌که‌ زبان فارسی‌ پیچیدگی های ساختاری نسبت به سایر زبان ها دارد و همچنین تحقیقات کمتری در این زمینه انجام گرفته است، این پژوهش از نوع کاربردی، توسعه ای می باشد که برای انجام آن می توان به روش پژوهش آزمایشی و استفاده از ابزار متن کاوی اشاره کرد، به این صورت که در یک محیط کاملاً تحت کنترل و با توانایی ثابت نگه داشتن سایر متغیرها انجام می گردد.
در جامعه اطلاعاتی دسته‌بندی متون به‌وسیله افراد نخبه و به‌صورت دستی انجام می‌گیرد. دسته‌بندی متون آن‌هم با این حجم و به‌صورت دستی غیرممکن به نظر می‌رسد، بنابراین ما ناگزیریم که به دنبال روش‌هایی برای دسته‌بندی خودکار متون باشیم. از سوی دیگر ذخیره‌سازی، پردازش و تحلیل این حجم از اطلاعات تبدیل به چالشی جدی شده است. با توجه به حجم بالای اخبار، داده ها، اطلاعات، اسناد و پیچیدگی حفظ و نگهداری آنها، لازم است سیستمی  جهت مدیریت دریافت، حفظ و نگهداری اخبار موجود، بکار گرفته شود. پیچیدگی سازمان ها نیاز به متمرکز بودن اخبار، اسناد، طبقه بندی درست، گردش صحیح اخبار و سهولت در دسترسی به آنها را ایجاد می نماید. مدیریت مستندات این امکان را برای سازمان های اطلاعاتی فراهم می آورد که اخبار و اسناد دریافتی یا موجود را به درستی طبقه بندی نموده، آنها را حفظ، نگهداری و بازیابی نماید. با بررسی، تحلیل و پردازش در این پژوهش به این نتیجه می رسیم که دقت‌ و نتایج حاصل روش پیشنهادی‌ روی‌ متون خبری برخط نشان می‌دهد؛ مدل ماشین‌ بردار پشتیبان دارای‌ دقت 29/93‌، صحت 32/93، فراخوانی 96/92 و خطای 71/6 است‌.

کلیدواژه‌ها


عنوان مقاله [English]

Management of Farsi Content Documentation of Online News Media in the Intelligence Society

نویسندگان [English]

  • Hamid Mirzaei Dehnavi 1
  • Mohammad Ali Karamati 2
  • Mohammad Ali Ameri Habibabadi 3
1 Department of Information Technology Management, Tehran Center Branch, Islamic Azad University, ,
2 Department of Industrial Management, Tehran Center Branch, Islamic Azad University, Tehran, Iran. (Corresponding author)
3 Department of Management, Research Institute of Law Enforcement Sciences and Social Studies, Tehran, Iran
چکیده [English]

The age we live in is the age of information, and the most important issue for organizations is the mastery of this information. With the ever-increasing growth of news in the digital world and the Internet, the issue that becomes important is the classification of this information and our quick and cheap access to it. This importance cannot be achieved except by doing the methods referred to as text classification. The purpose of this research is to classify news texts into predefined categories, which is done using the automatic model tool, which is considered one of the subsets of text mining. Considering the importance of the subject and the work that has been done in this field for other languages ​​of the world, the need to classify Persian texts is well felt. It is noteworthy that research has been developed and used for English texts, but since the Persian language has structural complexities compared to other languages ​​and also less research has been done in this field, this research is of an applied type. It is a development that can be done using the experimental research method and the use of text mining tools, as it is done in a completely controlled environment with the ability to keep other variables constant. In the intelligence society, the classification of texts is done manually by elite people. It seems impossible to categorize texts with this volume manually, so we are forced to look for methods to automatically categorize texts. On the other hand, storing, processing and analyzing this amount of information has become a serious challenge. Due to the high volume of news, data, information, documents and the complexity of maintaining and maintaining them, it is necessary to use a system to manage receiving, maintaining and maintaining existing news. The complexity of organizations creates the need for centralization of news, documents, correct classification, correct circulation of news and ease of access to them. Document management provides the possibility for information organizations to correctly classify received or existing news and documents, preserve, maintain and retrieve them. By examining, analyzing and processing in this research, we come to the conclusion that the accuracy and results of the proposed method on online news texts show; The support vector machine model has 93.29 precision, 93.32 accuracy, 92.96 recall, and 6.71 error.

کلیدواژه‌ها [English]

  • Classification
  • Document Management
  • Information and Classification
  • Persian Content
  • Text Mining