تفاوت سرقت ادبی با تشابه متنی
در بررسی اصالت متن، دو مفهوم مرتبط و در عین حال مجزا وجود دارد:
تشابه متنی (Similarity) و سرقت ادبی (Plagiarism)
گزارشی که نرم افزار های تشخیص سرقت ادبی پس از بررسی متن ارائه میدهند در واقع تشابه متنی اثر شما با سایر متون است (نه سرقت ادبی) که معمولا در قالب یک عدد (بین ۰ تا ۱۰۰) نمایش داده میشود. البته در بعضی گزارشات، موارد تشابه متنی و سرقت ادبی دقیقا یکسان هستند. این یعنی گزارش نرم افزار بسیار دقیق بوده و درصد تشابه متنی که نرم افزار داده در واقع همان درصد سرقت ادبی است. اما همیشه گزارش اینقدر دقیق نیست.
در گزارشی که از نرم افزار آیثنتیکیت گرفته میشود هم از عبارت تشابه استفاده شده، نه سرقت ادبی.
هرتشابه متنی ای سرقت ادبی نیست:
- تشابه ممکن است شامل اصطلاحات پر تکرار و کوتاه باشد:
عباراتی مثل Abstract, Introduction, This research aims to, etc
- تشابه ممکن است شامل نقل قول های متن باشد
- پیوست ها یا اپندیکس میتواند تشابه تشخیص داده شود
- همچنین قسمت منابع در انتهای مقاله قطعا تشابه تشخیص داده خواهد شد
اما هیچ کدام از موارد بالا سرقت ادبی نیست.
عبارات پر تکرار و مشابه در تمام مقالات وجود دارند و نمیتوان آنها را سرقت علمی محسوب کرد. همچنین نقل قول های متن نیز ممکن است در تشابه متنی لحاظ شود اما نقل قول به هیچ عنوان نباید سرقت ادبی شمرده شود. البته متنی که بیش از حد متعارف نقل قول داشته باشد، متنی ضعیف و بخیه شده محسوب میشود و قاعدتا در هیچ ژورنالی چاپ نخواهد شد. پیوست های مقاله نیز معمولا شامل اطلاعاتی است ( مثل تست های چند گزینه ای و پرسش نامه ها) که در سایر متون نیز استفاده شده اند و نمیتوان آنها را سرقت علمی به حساب آورد. قسمت منابع در آخر مقاله نیز قطعا به عنوان تشابه متنی شناخته خواهد شد. اما قسمت منابع و رفرنس ها در آخر مقاله به هیچ عنوان سرقت ادبی نیست.
جالب اینجاست که بسیاری مجلات و دانشگاهها، درصد و ایندکس تشابه متنی را معادل درصد و ایندکس سرقت ادبی میدانند.
به طور مثال، تشابه در عبارات پرتکرار، نقل قول ها، پیوست ها و حتی قسمت منابع و رفرنس ها را هم سرقت علمی میدانند. و این اشتباه است. جالب است بدانید این موارد به راحتی در تنظیمات نرم افزار آیثنتیکیت قابل حذف هستند.
اما چرا معمولا این موارد را از گزارش نرم افزار حذف نمیکنند؟
شاید یک دلیل این باشد که به این ترتیب، تصمیم گیری راحت تر است. یعنی گزارش گیری با حداکثر حساسیت در نرم افزار (که اتفاقا تنظیمات پیشفرض نرم افزار هم همین است). شاید هم عدم آشنایی با تنظیمات نرم افزار دلیل این کار باشد. اما به عقیده ما دلیل اصلی، عدم آشنایی تصمیم گیرنده ها با مفهوم تشابه متنی و اشتباه گرفتن آن با سرقت ادبی است.
گزارش نرم افزار باید توسط یک شخص آشنا با موضوع متن بررسی شود و موارد تشابه جداگانه و تک تک ارزیابی شوند تا بتوان به درستی موارد سرقت ادبی را مشخص کرد. تصمیم گیری صرفا بر اساس درصد تشابه متنی اشتباه است. هر تشابه متنی ای سرقت ادبی نیست. موارد تشابه متنی باید به تفکیک بررسی شوند تا مقدار دقیق سرقت ادبی مشخص شود.
اما یک اشتباه بسیار رایج و مرتبط دیگر نیز وجود دارد. اینکه (پس از تفکیک موارد تشابه و تشخیص دقیق درصد سرقت ادبی) تصمیم گیری در مورد مقاله را صرفا بر اساس عدد درصد سرقت ادبی انجام داد.