Mô phỏng thuật toán, tưởng dễ mà khó!

Posted in Algorithm, Dev's Life

Bài viết trước mình có đề cập đến thuật toán, bạn đọc có thể đọc lại tại đây
http://blog.ntechdevelopers.com/thuat-toan-lieu-co-ma-thuat-phuc-tap-va-bi-an-nhu-moi-nguoi-van-nghi/
Hôm nay mình sẽ nói về việc áp dụng mô phỏng thuật toán trong quá trình học tập hiệu quả hơn!

Continue reading

Bạn hỏi tôi cào dữ liệu để làm gì à?

Posted in Dev's Life, Tips

Sau mấy bài viết về Cào dữ liệu, có bạn nào tự hỏi mấy ông này cào dữ liệu về làm cái khỉ khô gì không?
Đùa chứ tuỳ mục đích của mỗi người hay mỗi tổ chức mà có những cách xử lý dữ liệu đã cào được dùng vào mục đích gì.

Dưới đây là một số mục đích mà mình thấy được đưa ra nhiều nhất.

Continue reading

Cha nội Murphy làm hại anh chị em ta rồi! Tranh luận nhé!

Posted in Dev's Life
Hôm trước trong bài viết về Entropy mình có đề cập đến định luật Murphy.
Nếu bạn nào chưa đọc thì có thể đọc lại tại đây nhé!
Hôm nay, mình sẽ cùng bàn xem Murphy thực sự là khoa học hay chỉ là ngầu nhiên.
Trước tiên mình nhắc lại về định luật bánh bơ này 1 chút nhé!

Continue reading

Tìm kiếm google (Google search) – Liệu bạn có xài hiệu quả?

Posted in Tips
1. Cơ bản về Google:
Đơn giản nhất là gõ vào những từ bạn muốn tìm.
Gõ ít thì kết quả nhiều, và ngược lại. Hãy giới hạn phạm vi tìm kiếm bằng cách kết hợp thêm những từ ngữ khác.
Nếu bạn muốn tìm một cụm từ, hãy để nó trong cặp ngoặc kép ‘”’.
Trong quá trình tìm kiếm, các biến thể của từ (vd: diet, dietary,…) cũng được đưa vào quá trình tìm kiếm. Vì vậy bạn không cần phải lo lắng về việc này.
Lưu ý: Google không phân biệt hoa thường khi tìm kiếm.
2. Tìm kiếm nâng cao:
Dùng dấu ‘+’
Một số từ thông dụng trong tiếng Anh có thể bị bỏ qua khi tìm kiếm (vd: I, to, do, a, go, the,…). Nhưng nếu từ đó có ảnh hưởng đáng kể đến kết quả tìm kiếm của bạn, bạn có thể thêm vào dấu ‘+’ phía trước.
Code:
Star Wars Episode +I
Nhưng tốt hơn vẫn là dùng cặp ngoặc kép
Code:
“Star Wars Episode I”
 

Continue reading

Cào dữ liệu ư!, Crawling ư!, Tại sao Microsoft Excel lại không thể?

Posted in Algorithm, Dev's Life, Tips

Bài viết trước mình đã đề cập tới việc Cào dữ liệu (Web Crawling và Web Scraping) từ các trang web khác. Bạn có thể đọc lại tại đây:
http://blog.ntechdevelopers.com/web-crawling-va-web-scraping-su-tranh-cai-giua-an-cap-tai-lieu-hay-la-mot-cong-nghe-thu-thap-du-lieu/

Hôm nay mình sẽ nói về ứng dụng của việc cào dữ liệu đối với những người không biết gì đến lập trình.
Viêc cào dữ liệu này bạn hoàn toàn có thể dùng excel để thu thập dữ liệu với mục đích cá nhân của mình mà không cần biết đến kiến thức lập trình.

Continue reading

Web Crawling và Web Scraping – Sự tranh cãi giữa ăn cắp tài liệu hay là một công nghệ thu thập dữ liệu

Posted in Algorithm, Dev's Life, You don't know Dev!

Nhiều người nghĩ rằng, việc sử dụng Web Scraping để quét, đánh cắp dữ liệu là hành động xấu. Tuy nhiên, trong một số trường hợp, chủ dữ liệu muốn truyền tải dữ liệu đến càng nhiều người càng tốt, chúng lại mang tới lợi ích không ngờ. Chẳng hạn, website chính phủ cung cấp dữ liệu cho các website công cộng.
Trong thời đại kỷ nguyên số như hiện nay, ai cũng biết rằng dữ liệu internet là một nguồn data dồi dào và phong phú nhất. Mà dữ liệu thì lại chẳng khác gì vàng cả. Người ta còn đo sự giàu có của một công ty dựa trên lượng dữ liệu mà công ty đó có cơ mà. Hãy thử điểm qua các công ty công nghệ xem họ có bao nhiêu dữ liệu?

Continue reading