วิธีการใช้งาน Numpy เบื้องต้น
NumPy (Numerical Python) คือ Library ที่ผู้ใช้งาน Python และโดยเฉพาะอย่างยิ่งคนที่ทำงานเกี่ยวกับ Data science และ Machine Learning ต้องรู้จัก เนื่องจาก Numpy สามารถทำงานได้เร็วกว่า Standard Library ของ Python มากๆ และด้วยการใช้งานที่ง่ายและไม่ซับซ้อน Numpy จึงเป็น Library ตัวแรกๆที่เรา Install เข้ามาใช้งาน
ทำไมต้องใช้ NumPy?
- จัดการกับข้อมูลจำนวนมากได้อย่างมีประสิทธิภาพ
- รองรับการทำงานกับ Array หลายมิติ (ndarray)
- เร็วกว่าการใช้ List ของ Python
- รองรับการทำงานด้านสถิติ, Linear Algebra และการแปลงข้อมูล
- เป็นพื้นฐานของ Library ยอดนิยมอื่นๆ เช่น Pandas, TensorFlow และ Scikit-learn
ขั้นตอนการติดตั้งและใช้งาน NumPy
เราสามารถติดตั้ง Numpy เข้ามาใช้งานได้เลยด้วยการใช้ pip
ดังนี้
pip install numpy
การใช้งาน Numpy
หลังจากติดตั้ง Numpy เข้ามาเรียนร้อยแล้วเราสามารถ import
เอา Numpy เข้ามาใช้งานได้เลย
import numpy as np
จริงๆขื่อเล่นหรือ Alias เราสามารถตั้งอะไรก็ได้แต่โดยส่วนมากเราจะใช้ np
สร้างอาเรย์ (Array)
หลังจาก Import Numpy เข้ามาใช้งานแล้ว ลองสร้าง Array ขึ้นมาใช้งานด้วยคำสั่งต่างๆ ดังนี้
# สร้าง Array 1 มิติ
a = np.array([1, 2, 3])
# สร้าง Array 2 มิติ
b = np.array([[1, 2, 3], [4, 5, 6]])
# สร้าง Default Array แบบต่างๆ
# สร้าง Array ขนาด 2x3 โดยที่สมาชิกใน Array ทุกตัวที่มีค่าเป็น 0
zeros = np.zeros((2, 3))
# สร้าง Array ขนาด 3x3 โดยที่สมาชิกใน Array ทุกตัวที่มีค่าเป็น 1
ones = np.ones((3, 3))
คุณสมบัติของอาเรย์
a.shape # ขนาด (rows, columns)
a.ndim # จำนวนมิติ
a.size # จำนวนสมาชิกทั้งหมด
a.dtype # ประเภทข้อมูล (เช่น int32, float64)
การเข้าถึงข้อมูล
a = np.array([[10, 20, 30], [40, 50, 60]])
print(a[0, 1]) # ผลลัพธ์: 20
print(a[:, 1]) # ผลลัพธ์: [20 50]
การดำเนินการทางคณิตศาสตร์
x = np.array([1, 2, 3])
y = np.array([4, 5, 6])
print(x + y) # [5 7 9]
print(x * y) # [ 4 10 18]
print(np.dot(x, y)) # dot product = 1*4 + 2*5 + 3*6 = 32
ฟังก์ชันที่น่าสนใจ
np.mean(x) # ค่าเฉลี่ย
np.std(x) # ส่วนเบี่ยงเบนมาตรฐาน
np.max(x) # ค่าสูงสุด
np.min(x) # ค่าต่ำสุด
np.sum(x) # ผลรวมทั้งหมด
np.linspace(0, 1, 5) # สร้างอาเรย์ 5 ค่า ระหว่าง 0 ถึง 1
การจัดรูปร่างอาเรย์ (Reshape)
a = np.array([1, 2, 3, 4, 5, 6])
a_reshaped = a.reshape((2, 3)) # เปลี่ยนเป็น 2 แถว 3 คอลัมน์
การทำงานกับ Library อื่นๆ
นอกจากการทำงานต่างๆ ที่ได้แนะนำไปข้างต้นแล้ว NumPy ยังถูกนำไปใช้ใน Library อื่นๆ อีกหลายตัว ยกตัวอย่างเช่น
- Pandas เป็น Library สุดฮิตสำหรับสาย Data Science ซึ่ง Pandas จะคอยทำหน้าที่ Import, Filter และ Cleansing Data
- Matplotlib เป็น Library ที่ทำหน้าที่จัดการ Visualization ซึ่ง Matplotlib ใช้ Numpy Array ในการเก็บข้อมูล
- Scikit-Learn เป็น Library สำหรับคนที่ทำ Machine Learning ต้องรู้จัก
สรุป
NumPy คือเครื่องมือพื้นฐานที่ทุกคนที่เริ่มต้นสาย Data Science หรือ Python ควรรู้จัก การเรียนรู้การใช้งาน NumPy อย่างเข้าใจจะช่วยให้คุณสามารถทำงานกับข้อมูลจำนวนมากได้อย่างมีประสิทธิภาพและรวดเร็ว