Product Design, Manufacturing & Innovation Resources
بيت » نظام R Tidyverse البيئي

نظام R Tidyverse البيئي

2010
  • Hadley Wickham
مساحة عمل برمجة R مع أدوات تحليل البيانات Tidyverse وتصورات ggplot2.

(صورة تم إنشاؤها للتوضيح فقط)

Tidyverse هي مجموعة من حزم R مصممة لعلم البيانات، تشترك في فلسفة تصميم أساسية، وقواعد نحوية، وهياكل بيانات. طوّرها هادلي ويكهام وآخرون، وهي توفر مجموعة أدوات متسقة وفعّالة لاستيراد البيانات، وترتيبها، وتحويلها، وتصورها، ونمذجتها. من بين الحزم الرئيسية: ggplot2، وdplyr، وtidyr، وreadr، والتي تُركّب معًا باستخدام الأنابيب.

The Tidyverse is an opinionated ecosystem of R packages that has profoundly influenced modern data analysis in R. It is built on the concept of “tidy data,” a standard way of organizing data where each variable is a column, each observation is a row, and each type of observational unit is a table. This consistent data structure allows for the creation of tools that compose together elegantly.

تتمثل الفلسفة الأساسية لـ Tidyverse في جعل تحليل البيانات أكثر سهولةً وفهمًا من قِبل المستخدمين. ويتحقق ذلك من خلال توحيد أسماء الدوال والوسائط، والاستخدام المكثف لعامل الربط (`%>%` أو `|>`)، مما يسمح بربط العمليات معًا في تسلسل يُقرأ كجملة (على سبيل المثال، `data %>% filter(') %>% group_by(') %>% summarize(')`). توفر الحزم الرئيسية أدوات متخصصة: `dplyr` لمعالجة البيانات، و`ggplot2` لتصور البيانات التصريحي استنادًا إلى "قواعد الرسومات"، و`tidyr` لتنظيم البيانات، و`readr` لاستيراد البيانات بسرعة، و`purrr` للبرمجة الوظيفية. مع أن Tidyverse تُنتقد أحيانًا لكونها "لهجة" منفصلة؛ أصبحت حزمة Tidyverse الخاصة بلغة R معيارًا فعليًا للعديد من علماء البيانات نظرًا لكفاءتها وقدرتها التعبيرية.

UNESCO Nomenclature: 1203
- علوم الحاسب الآلي

يكتب

البرنامج/الخوارزمية

الاضطراب

ثوري

الاستخدام

الاستخدام الواسع النطاق

السلائف

  • لغة البرمجة R نفسها
  • مفهوم "قواعد الرسومات" بقلم ليلاند ويلكنسون
  • مفهوم مشغل الأنابيب من غلافات يونكس ولغات البرمجة الأخرى
  • مبادئ البرمجة الوظيفية
  • بنية إطار البيانات في R

التطبيقات

  • تنظيف البيانات وإعدادها للتعلم الآلي
  • إنشاء تصورات بيانات معقدة وعالية الجودة للنشر باستخدام ggplot2
  • استكشاف البيانات وتحليلها التفاعلي في دفاتر R
  • بناء خطوط أنابيب تحليل البيانات القابلة للتكرار
  • تدريس مفاهيم علم البيانات باستخدام قواعد لغوية متسقة وبديهية

براءات الاختراع:

    أفكار ابتكارات محتملة

    بسبب عمليات جمع البيانات من خلال برامج الروبوت، والتي تتجاوز حاليًا 40 ألفًا يوميًا، فإن هذا المحتوى مخصص لأعضاء المجتمع فقط.
    > تسجيل الدخول < أو > سجل < (مجاني 100٪) للوصول إلى هذا، وكذلك جميع المحتويات والأدوات الأخرى المقيدة.

    ذات صلة بـ: Tidyverse، R، علم البيانات، ggplot2، dplyr، هادلي ويكهام، البيانات المنظمة، تصور البيانات، معالجة البيانات، عامل الأنابيب.

    السياق التاريخي

    نظام R Tidyverse البيئي

    1990
    1993
    1998
    2010
    2016
    1990
    1993
    1997-04-23
    2001
    2010
    2020

    (إذا كان التاريخ غير معروف أو غير ذي صلة، على سبيل المثال "ميكانيكا الموائع"، يتم توفير تقدير تقريبي لظهوره الملحوظ)

    الاختراع والابتكار والمبادئ التقنية ذات الصلة

    الصور بالحجم الكامل والتنزيلات متاحة فقط 100% مجاناً للأعضاء المسجلين.