مريم | بيانات
مريم | بيانات

@mrym_data

8 تغريدة 3 قراءة Dec 16, 2022
🚨Task on dataset (Houses for sale ) in R
1⃣ استيراد الداتا
2⃣ فهم بناء الداتا وايجاد بعض الارتباطات
3⃣ ايجاد الانحدار الخطي البسيط
@AliGreo
#تحليل
1⃣ استيراد الداتا
houses <- read.csv(" file place .csv ")
View(houses)
#تحليل
2⃣ فهم بناء الداتا
str(houses)
حيث انه يوجد 1728 ملاحظة و16 متغير ومعظمهم من نوع نصي ، الان يمكن تنظيف الداتا (cleaning data ) وعمل pre-processing data باستخدام حزمة dplyr .
#تحليل
في عملية المعالجة نريد اظهار جميع الاعمدة ما عدا العمودين الاول والثاني لذلك نستخدم كود الفلترة
houses<- houses %>% select (c(-1,-2) )
#تحليل
لعمل بعض التصورات البيانية حول الداتا نقوم باستيراد ggplot لمتغير كمي واحد عن طريق histogram
library(ggplot2)
ggplot(data=houses,aes(x=price))+
geom_histogram(bins=40،fill="lightblue",col="blue")
#تحليل
يمكن عمل تصور من خلال boxplot حيث يستخدم عند وجود متغير كمي ومتغيرين وصفيين
ggplot(data=houses , aes(y=price, x=waterfront , fill=waterfront))+geom_boxplot()
ggplot(data=houses, aes(y=price , x=air_cond, fill=air_cond)) +geom_boxplot ()
#تحليل
لايجاد علاقة الانتشار بين متغيرين كميين
ggplot(houses, aes(x=living_area , y= price)) +geom_point() + geom_smooth(method="lm",se="F")
ggplot(houses, aes(x=age,y=price))+ geom_point(col="purple")+geom_smooth(method="lm",se="F")
#تحليل
لايجاد العلاقة بين متغيرين كميين بناء على عامل وصفي
ggplot(houses, aes(x=living_area,y=price,col=factor(rooms)))+ geom_point(col="purple")+geom_smooth(method="lm",se="F")
ريتويت من فضلك لتعم الفائدة 💥💥
#تحليل

جاري تحميل الاقتراحات...