🔧

Data Manipulation

Data manipulation involves cleaning, transforming, and reshaping data to prepare it for analysis and make it suitable for specific tasks.

Overview

Data manipulation focuses on cleaning, transforming, and reshaping data. Real-world data is often messy and requires manipulation before analysis.

Data manipulation includes tasks like filtering, sorting, aggregating, merging, and reshaping data using tools like pandas, dplyr, and SQL.

Key Technologies

Python Libraries

Polars
Dask

R Packages

dplyr
tidyr
data.table
tidyverse

Tools

Excel
OpenRefine
Data Wrangling Tools

Key Concepts

Data Cleaning

Clean data by handling missing values, removing duplicates, and correcting errors.

Data Transformation

Transform data by reshaping, aggregating, and creating derived variables.

Data Merging

Combine data from multiple sources using joins, merges, and concatenation.

Efficient Processing

Process large datasets efficiently using vectorized operations and optimized libraries.

عضویت درChangelog

📚
جزو اولین کسانی باشید که نکته‌های قابل اجرا را دریافت می‌کنند.

دیدگاه‌های هفتگی درباره‌ی مهندسی نرم‌افزار، اجرا و درآمد مستقل — به‌علاوه‌ی درس‌های روشن و قابل اجرایی که در حین ساختن، انتشار و تکرار یاد می‌گیرم.

با ارسال این فرم، در خبرنامه‌ی رایگان من ثبت‌نام می‌شوید. ممکن است ایمیل‌های دیگری درباره‌ی دوره‌هایم هم برای شما بفرستم. هر زمان می‌توانید لغو عضویت کنید. برای اطلاعات بیشتر، به سیاست حریم خصوصی.