مقاله برتر جشنواره وب ایران در آی تی یاب

اختتامیه چهارمین دوره جشنواره وب ایران در تاریخ ۶ بهمن ماه در سالن مرکز مطالعات بهره وری و منابع انسانی برگزار گردید

کاندیداهای چهارمین جشنواره وب ایران معرفی شدند و دومین کنفرانس خبری چهارمین جشنواره وب ایران با حضور خبرنگارها و اصحاب رسانه برگزار گردید.

جشنواره وب ایران از معتبرترین جشنواره های حوزه فناوری اطلاعات است که تاکنون سه دوره آن از سال ۱۳۸۷ توسط پایگاه خبری وب سایت های ایران وبنا به همراه گروهی از فعالان و متخصصین حوزه وب در ایران برگزار گردیده است. امسال نیز چهارمین دوره جشنواره در مقیاس بزرگتری و با برنامه های متنوع تر در سرتاسر کشور برگزار شد و وب سایت های ایرانی در بیش از ۹۰ گروه مختلف به رقابت پرداختند و برترین های امسال نیز در پایان داوری در روز اختتامیه جشنواره معرفی و از آنها تقدیر شد

رقابت در شاخه های گوناگون جشنواره صورت پذیرفت و مفتخریم اعلام نمائیم که آقای مهندس میلاد مهاجر (برنامه نویس سایت) با ارایه مقاله در این جشنواره شرکت کرده و مقاله ایشان به عنوان بهترین مقاله معرفی گردید .

ضمن عرض تبریک خدمت ایشان و تشکر مجدد بابت همکاری صمیمانه جا دارد این موفقیت را به کلیه همکاران شرکت رایمند تبریک گفته و صمیمانه قدردانی نمائیم.

محمد کرمی

روش های نوین مدل سازی اطلاعات در وب معناگرا

Semantic Database Design

چکيده: از زمانی که وب به وجود آمد بسیاری در مورد وب معناگرا صحبت می کردند . این مسئله هیچگاه با یک برنامه عملی مهم مواجه نشده ولی در حال حاضر روش های مهم و کارآمدی هم وجود دارد. در این مقاله سعی شده یکی از این دیدگاه های جدید در طراحی پایگاه های داده مورد بررسی قرار گیرد.

واژه هاي کليدي: وب معناگرا ، پایگاه داده رابطه ای، RDF ، SPARQL

1- مقدمه

در برنامه نویسی وب نوین قابلیت انعطاف بسیار مهم است به همین دلیل است کهframework های سبک روی زبان های پویا مثل Pylon , Django و Rails Ruby onبه سرعت در حال محبوب شدن هستند . به هر حال اکثر ما هنوز از پایگاه های داده ای رابطه ای استفاده می کنیم که برای الگو های تغییر ناپذیر طراحی شده اند .

2- روش های سنتی طراحی پایگاه داده

2-1- پایگاه داده رابطه ای

پایگاه های داده احتمالا مهمترین بخش از نرم افزار های کاربردی می باشند. پایگاه های داده ای رابطه ای در حال حاضر بین برنامه نویسان محبوبیت خاصی دارند. درابتدای این مقاله سعی خواهد شد روش سنتی مدل سازی داده ها بررسی شده سپس جایگزین های این روش معرفی شوند.

2-2- جداول داده ای

در مدل های پایگاه داده رابطه ای جداول داده ها بصورت مجموعه ای از صفات برای یک موجودیت خاص در مدل های پایگاه داده ذخیره می شود برای نمونه جدول زیر را برای ذخیره سازی اطلاعات دانش آموزان در نظر بگیرید.

2-3- مدل های رابطه ای

همانطور که می دانید فرایند نمایش اطلاعاتِ زیاد در یک سلول همیشه با مشکل مواجه بوده است لذا طراحی مدل های رابطه ای برای ذخیره سازی اطلاعاتِ مرتبط، ضروری به نظر می رسد. یک مدل رابطه ای تشکیل شده از چندین جدول است که اطلاعات و روابط بین این اطلاعات را تشکیل می دهد . شماتیک کلی برای پایگاه داده دانش آموزان به شکل زیر است .

شکل 1: نمونه ای از یک شمای رابطه ای

2-4- مشکلات پایگاه های داده اطلاعاتی

حال فرض کنید قرار است اطلاعات معلم ها نیز در این پایگاه داده قرار بگیرد به عنوان مثال داده هایی جدید به شکل زیر در اختیار شما قرار گرفته تا در مدل سازی در نظر گرفته شود.

جدول 1: دانش آموزان به صورت صفحه گسترده

شکل 2 : نمونه ی کامل تر جدول رابطه ای

همانطور که می دانید در یک نرم افزار بزرگ تعداد جداول به طرز چشمگیری افزایش پیدا می کند که نهایتا برنامه نویسان را با پایگاه های داده بزرگ و روابط پیچ در پیچ مواجه خواهد کرد .

شکل3 : پایگاه داده یک نرم افزار واقعی

اما برای رفع این مشکل چه باید کرد ؟ آیا به غیر از پایگاه داده رابطه ای راه دیگری برای طراحی پایگاه داده وجود ندارد ؟

3- طراحی پایگاه داده معناگرا

در این قسمت سعی خواهد شد مدل جدیدی از ذخیره سازی داده ها با رعایت معانی آنها معرفی شود.

3-1- معانی صریح

در مدل سازی پایگاه های داده رابطه ای داده ها به صورت موجودیت های مختلف با صفات متفاوت مدل می شوند . درحالی که در پایگاه های داده معناگرا اطلاعات به صورت گزاره ها معنی دار به صورت زیر در نظر گرفته می شوند

در شکل زیر جدول مدل شده اطلاعات به صورت گزار های بالا را مشاهده می کنید

Object	Predicate	Subject
“ali”	name	S1
“22465244”	tel	S1
“somewhere”	address	S1
S3	field	S1
Math	name	S2
19	grade	S2
S1	owner	S2
Math	name	S3
6	term_no	S3
S7	manager	S3

جدول 3: جدول داده های معناگرا

همانطور که می بینید جدول بالا برای انسان به راحتی قابل فهم است همینطور ماشین هم به آسانی آنرا تفسیر می کند .

مدل سازی بالا را می توان به صورت گراف نیز به صورت زیر نمایش داد

شکل 4: نمایش داده ها به صورت گراف

با نگاه کردن به جداول رابطه ای می توان معانی را از آنها استخراج کرد یک بار دیگر به جداول صفحه قبل دقت کنید.آیا می توانید معانی را ببینید ؟ به نمونه ی دیگری از مدل های معنا گرا دقت کنید .

شکل 5: اطلاعات مربوط به شهر تهران

یکی از ویژگی های مهم این نوع مدل سازی اطلاعات راحتی ادغام ساختارهاست بدون اینکه در شمای کلی طراحی شده تغییر ایجاد شود به عنوان مثال به نمونه ی زیر توجه کنید.

شکل 6: ادغام شماتیک به راحتی انجام می شود

3-2- پایگاه های داده معنا گرا

همانطور که ذکر شد برنامه نویسی وب به مرور زمان به سمت زبان های انعطاف پذیر و نسل چهارم مثل DJango , Pylons , Ruby on Rails پیش می رود پس تغییر در روش های مدل سازی اطلاعات هم باید تغییر کند در ادامه ی این مقاله به بعضی از تکنولوژی های موجود اشاره شده است .

3- تکنولوژی های پیاده سازی

3-1- RDF

مدل RDF روشی برای مدل سازی داده ها شبیه entity – relationship یا database diagram است که بر اساس ایده یSubject->predicate->object شکل گرفته است. یک گزاره به این شکل به نام یک سه گانه در RDF نام گذاری می شود در واقع RDF یک مدل انتزاعی است که شامل روش های مختلف سریال سازی می باشد[5] به نمونه های پیاده سازی شده در وب سایت های مختلف توجه کنید .

سایت Geonames در واقع سایتی شامل 10،000،000 اسم جغرافیایی با 7،500،000 ویژگی یکتاست که این اطلاعات به صورت مجموعه ای از URL ها قابل دسترس است به عنوان نمونه :

Subject	Predicate	Object
/3017382	Name	“France”
/3017382	wikipediaArticle	wiki/France
/3017382	population	64094000
/3030967	Name	“Bourgogne”
/3030967	parentFeature	/3017382
/3038033	Name	“Alsace”
/3038033	parentFeature	/3017382

جدول 4: ذخیره سازی اطلاعات در سایت Geonames

همانطور که مشاهده می کنید در این نوع ذخیره سازی اطلاعات نیازی به تفسیر ساختار و اطلاعات نیست و معانی واضح است

نحوه سریال سازی در سایت geonames به صورت زیر است :

@prefix geo: <http://www.geonames.org/ontology#>

<http://sws.geonames.org/3017382/>

geo:name "France";

geo:population 64094000.

<http://sws.geonames.org/3038033/>

geo:name "Alsace";

geo:parentFeature <http://sws.geonames.org/3017382/>

در حال حاضر بسیاری از سایت های روی وب برای ذخیره سازی و مدل سازی اطلاعات از تکنولوژی های وب معناگرا استفاده می کنند که باعث سادگی در اشتراک گذاری اطلاعات می شود به طوری که هر کدام از این وب سایت ها می توانند از اطلاعات دیگری استفاده کنند.

در جدول زیر برخی از سایت های استفاده کننده از تکنولوژی RDF و مدل سازی معناگرا آمده است .

آدرس	زمینه فعالیت	نام سایت
www.dublincore.org	جمع آوری متا دیتا	Dublin core
www.foaf-project.org	شبکه اجتماعی	FOAF
www.sioc-project.org	پرسش و پاسخ	SIOC
www.dbpedia.com	فرهنگ لغت	DBPedia
www.freebase.com	فرهنگ لغت	Freebase
www.getmasti.com	موتور جستجو	getmasti

جدول 5: لیست برخی سایت های معناگرا

3-1- SPARQLزبانی برای Query روی RDF

زبان پرس جوی SPARQLروشی برای ارسال انواع Query روی پایگاه داده RDFاست این زبان تمامی عملیات های پرس و جوی پایگاه های داده و همچنین عملیات های مختلف روی گراف ها را دارا می باشد . خروجی SPARQL می تواند مجموعه ای از داده ها یا گراف های RDF باشد[6] .

نمونه ای از یک نرم Query روی RDF را ملاحظه کنید :

select?name

where {? student1 name ?name .

?has course ?course_id .

?student1 owner ?course_id .

FILTER (?term_id > 7 ) }

همانطور که می بینید در این نوع Query اثری از جداول دیده نمی شود .

مراجع

[1] Toby Segaran, Why Semantics. Webstock conference in Wellington, New Zealand, pp. April 2009.

[2] “SPARQL Query Language for RDF,”W3C Recommendation 15 January 2008.

[3] J.van der ham, “Using RDF to Describe Networks,”Advanced Internet Research Group Universiteit van Amsterdam September 2008.

[4] E. F. CODD, “Extending the Database Relational Model to Capture more Meaning,”IBM research Laboratory 2010.

[5] James A. Hendler, “Semantic web for the working ontologist: modeling in RDF, RDFS and OWL“ , morgan Kaufmann pub 2010.

[6] B DuCharme . “learning SPARQL“O'Reilly Media, Inc., Jul 21, 2011

5 4 3 2 1

۰ نظر

ارسال نظر