Học SQL trước khi học Python cho người mới bắt đầu
Python là một ngôn ngữ lập trình mạnh mẽ và dễ học, đặc biệt hữu ích khi làm việc với dữ liệu. Một trong những kỹ năng quan trọng mà bất kỳ ai làm việc với dữ liệu cũng cần biết là SQL (Structured Query Language) – ngôn ngữ dùng để thao tác với cơ sở dữ liệu.
1. Tại sao cần học SQL khi học Python?
- Kết nối dữ liệu dễ dàng: Hầu hết các ứng dụng thực tế đều cần truy vấn dữ liệu từ cơ sở dữ liệu như MySQL, PostgreSQL, SQLite.
- Khai thác dữ liệu hiệu quả: SQL giúp truy xuất, lọc, nhóm dữ liệu nhanh chóng trước khi xử lý bằng Python.
- Tích hợp với thư viện phân tích dữ liệu: Pandas hỗ trợ tích hợp SQL để làm việc với dữ liệu thuận tiện hơn.
2. Cài đặt SQLite để thực hành
SQLite là một cơ sở dữ liệu nh ẹ, không cần cài đặt máy chủ, rất phù hợp cho người mới học.
Cài đặt SQLite trong Python
Trước tiên, bạn cần cài đặt thư viện SQLite nếu chưa có:
import sqlite3
Bạn có thể tạo một kết nối đến một file database SQLite như sau:
conn = sqlite3.connect("my_database.db") # Kết nối đến file database
cursor = conn.cursor() # Tạo con trỏ để thao tác với dữ liệu
3. Các thao tác SQL cơ bản với Python
3.1. Tạo bảng trong SQLite
Khi làm việc với SQL, bạn cần tạo bảng để lưu trữ dữ liệu.
Ví dụ:
cursor.execute('''
CREATE TABLE users (
id INTEGER PRIMARY KEY,
name TEXT,
age INTEGER
)
''')
conn.commit()
3.2. Chèn dữ liệu vào bảng
Sau khi có bảng, bạn có thể thêm dữ liệu vào bằng câu lệnh INSERT
:
cursor.execute("INSERT INTO users (name, age) VALUES ('Alice', 25)")
cursor.execute("INSERT INTO users (name, age) VALUES ('Bob', 30)")
conn.commit()
3.3. Truy vấn dữ liệu với SQL
Bạn có thể sử dụng SELECT
để lấy dữ liệu từ bảng:
cursor.execute("SELECT * FROM users")
rows = cursor.fetchall() # Lấy toàn bộ kết quả
for row in rows:
print(row)
📌 Kết quả mong đợi:
(1, 'Alice', 25)
(2, 'Bob', 30)
3.4. Cập nhật dữ liệu
Nếu bạn muốn cập nhật dữ liệu, sử dụng UPDATE
:
cursor.execute("UPDATE users SET age = 26 WHERE name = 'Alice'")
conn.commit()
3.5. Xóa dữ liệu
Xóa một dòng dữ liệu với DELETE
:
cursor.execute("DELETE FROM users WHERE name = 'Bob'")
conn.commit()
4. Kết hợp SQL với Pandas
Bạn có thể sử dụng Pandas để đọc dữ liệu trực tiếp từ SQL vào DataFrame:
import pandas as pd
df = pd.read_sql_query("SELECT * FROM users", conn)
print(df)
5. Kết luận
- SQL là một kỹ năng quan trọng khi làm việc với dữ liệu.
- Python hỗ trợ tốt việc thao tác SQL với thư viện
sqlite3
vàpandas
. - Biết cách sử dụng SQL trong Python sẽ giúp bạn xử lý dữ liệu hiệu quả hơn.
Bạn đã sẵn sàng học SQL cùng Python chưa? Hãy thử ngay trên máy của bạn! 🚀