درباره

ما که هستیم؟

پایگاه داده‌ باز ایران ابتکار مشترک افراد و سازمان‌هایی است که به موضوع داده‌ باز و شفافیت علاقه‌مندند. پایگاه داده‌ باز ایران مشتاق گسترش دامنه‌ی اعضای خود است، اگر به موضوع داده‌ باز علاقه‌مندید، لطفا با ما تماس بگیرید.

داده باز چیست؟

به زبان ساده و همانگونه که موسسه داده‌ باز (Open Data Institute) تعریف می‌کند، داده‌ باز داده‌ای است که «همه بتوانند به آن دسترسی داشته‌ باشند، از آن استفاده کنند و به اشتراک بگذارند». به طور خاص، موسسه دانش باز بین‌المللی (Open Knowledge International) کتابچه راهنمایی در مورد داده‌ باز منتشر کرده و در آن توضیح می‌دهد که داده در صورتی باز به حساب می‌آید که از سه اصل اساسی زیر تبعیت کند:

  • در دسترس باشد، با هزینه‌ای معقول برای باز تولید آن.
  • استفاده و توزیع مجدد آن امکان‌پذیر باشد، به این معنی که مجوز آن اجازه‌ی استفاده و توزیع مجدد آن را بدهد.
  • امکان مشارکت همگانی داشته باشد، به این معنی که استفاده، استفاده مجدد و توزیع دوباره داده‌ها محدودیتی نداشته باشد.

چرا پایگاه داده‌ باز ایران؟

سازمان‌های دولتی در ایران در همه سطوح -شهری، استانی و ملی- داده‌های عمومی فراوانی منتشر می‌کنند. اما در بسیاری از مواقع این داده‌ها به راحتی قابل دسترسی نیستند: یا در فرمت‌های غیرقابل دسترس مانند پی‌دی‌اف یا عکس عرضه شده‌اند،‌ یا در پس لایه‌های مختلف وبسایت‌های رسمی آمده‌اند یا اصلا در قالب دیجیتال عرضه نشده‌اند.

پایگاه داده‌ باز ایران قصد دارد داده‌های دولتی ایران را در یک جا جمع کرده و آن‌ها را در قالب‌هایی که با ماشین قابل خواندن باشند (مانند CSV یا JSON) در یک کانون مرکزی ارائه دهد. هدف ما این است که به پایگاه آنلاین معتبر داده برای محققان، خبرنگاران و شهروندان ایرانی تبدیل شویم؛ و معتقدیم وجود چنین پایگاهی به افراد کمک می‌کند تا عملکرد و سیاست‌های دولت خود را بهتر درک کنند.

باز و رایگان بودن داده یکی از ویژگی‌های کلیدی دولت پاسخگو و مسئول است. در این مسیر، پایگاه داده‌ باز ایران امیدوار است بتواند حوزه‌هایی را که مسئولان ایرانی می‌توانند شفافیت فعالیت‌های خود را بالا ببرند، برجسته کند. این کار با در اختیار عموم گذاشتن داده و دسترسی راحت به داده‌ها ممکن است.

روش کار ما چیست؟

یک پایگاه داده‌ باز، خود نیز باید باز باشد. یکی از ویژگی‌های برجسته پایگاه داده‌ باز ایران این است که کل فرآیند تکنولوژی و معماری پلتفرم آن بر روی CKAN که یکی از پلتفرم‌های پیشرو در منابع داده‌ باز است به صورت عمومی قابل دسترس است. کدهای سایت در اینجا در دسترس است، مشخصات داده‌ها و همه اطلاعات در مورد مجموعه داده‌های موجود را نیز اینجا می‌توان دید.

روش جمع‌آوری و تمیز کردن داده (که به آن اصطلاحا تمیزکاری داده یا data ingest می‌گوییم) به ماهیت مجموعه داده بستگی دارد. در برخی موارد ممکن است که اسکریپت خودکار (Automated Script) طراحی کنیم تا کار را برای ما انجام دهد. کد همه اسکریپت‌هایی که طراحی می‌کنیم اینجا در دسترس خواهند بود.

برای به دست آوردن داده‌هایی که در فرمت‌های ناخوانا و پیچیده حبس شده‌اند نیز از ابزارهای مختلف استفاده می‌کنیم. به عنوان مثال، برای داده‌هایی که به صورت پی‌دی‌اف عرضه شده‌اند در حال حاضر از Tabula استفاده می‌کنیم که نیازمند فرآیندی دستی است.

به دلیل این فرآیند دستی، امکان وجود تناقضات در این مجموعه داده‌ها وجود دارد. اگر با این خطاها برخورد کردید، لطفا با ما تماس بگیرید. و در نظر داشته باشید که تلاش برای تحقیق بیشتر در جهت یافتن اطلاعات تکمیلی برای تصدیق یافته‌های بر مبنای این مجموعه داده‌ها بر عهده خود کاربر وبسایت است. برای اطلاعات بیشتر لطفا صفحه مقررات را ببینید.