Sunday, 24 January 2016

ag và grep

grep là công cụ không thể thiếu với một *NIX-command line user.
grep là lệnh mà người ta gõ khi cần tìm một process trong output của lệnh ps, hay tìm xem file code nào chứa một từ khoá cho trước...
grep có mặt trên mọi hệ điều hành *NIX: linux-based (ubuntu, redhad...), freebsd, openbsd, OSX...
chắc chỉ trên Windows mặc định mới không có grep.
Tính phổ biến gần như thống trị này khiến vị thế của grep giống như bash, không nhanh nhất, không mạnh nhất, nhưng vẫn được dùng nhiều nhất.

Nhưng... không thể thay thế được, không có nghĩa là không làm.
Nếu chỉ có một con chim hót hay nhất hót, thì cả khu rừng sẽ rất im lặng. [1]

ag - the silver seacher (ag là ký hiệu hoá học của bạc - thống nhất đọc 2 chữ cái là "ây gi"), là một util nhằm thay thế  ``grep``:
$ whatis ag
ag (1)               - The Silver Searcher. Like ack, but faster.
ag sẵn sàng lên tivi quảng cáo:
  • với tốc độ search nhanh hơn (theo quảng cáo là 3-5 lần)

Wednesday, 20 January 2016

[ML] Phân loại vấn đề trong machine learning

Bộ môn machine learning phân các vấn đề nó giải quyết thành 2 nhóm: supervised learning và  unsupervised learning.

Supervised /ˈsuːpəvʌɪz/
Eng:  Observe and direct the execution of (a task or activity)
Vie: giám sát  

Vậy hiểu ở đây phân thành 2 loại học có giám sát và học không có giám sát.

1. supervised learning
Các vấn đề yêu cầu chương trình tạo ra các kết quả mới dựa vào các mẫu có sẵn.
Đề bài sẽ cho các dữ liệu và kết quả đúng, cần dự đoán kết quả cho các dữ liệu mới.
Các vấn đề thuộc supervised learning có thể kể đến vài ví dụ:

Tuesday, 19 January 2016

[ML] Giới thiệu machine learning

Machine learning /məˈʃiːn  ˈləːnɪŋ/ (mơ shin lơn ning) dịch nôm na là máy học, có tài liệu tiếng Việt ghi là học máy nhưng ở đây sẽ chỉ nhắc đến là machine learning hay ML.

Machine learning là gì?
Machine learning là một ngành khoa học (science) để làm cho máy tính có thể tự học mà không cần lập trình cụ thể chi tiết việc nó học. Hay có thể cho là bạn ném cho phần mềm một thuật toán, và nó tự xử lý các vấn đề (tương tự nhau) bằng thuật toán ấy.


Machine learning là một kỹ năng (skill) nằm trong top 10 kỹ năng hot nhất cho một data scientist (nhà khoa học về xử lý dữ liệu) hiện nay.

Machine learning là một lĩnh vực khá mới, được giảng dạy ở một số trường đại học lớn trên thế giới, đáng kể nhất là Stanford - và đặc biệt hơn lớp này có khoá học online miễn phí tại https://www.coursera.org/learn/machine-learning/ (lớp tiếp theo sẽ mở vào 25/Jan/2016)

Một số ứng dụng của machine learning

Saturday, 16 January 2016

[Python] Cuối tuần làm gì?

Chọn lựa luôn là điều khó khăn mà đôi khi, ta muốn phó mặc cho số phận...
Khó quá đừng bỏ quá, khó quá hãy để Python làm:


Thử cách khác với list comprehension: