Hướng dẫn học sâu cho người mới bắt đầu: Khái niệm cơ bản về mạng thần kinh
Học sâu là gì?
Học kĩ càng là một phần mềm máy tính mô phỏng mạng lưới tế bào thần kinh trong não. Nó là một tập hợp con của học máy dựa trên mạng lưới thần kinh nhân tạo với học tập biểu diễn. Nó được gọi là học sâu vì nó sử dụng mạng lưới thần kinh sâu. Việc học này có thể được giám sát, bán giám sát hoặc không giám sát.
Các thuật toán học sâu được xây dựng với các lớp được kết nối.
- Lớp đầu tiên được gọi là Lớp đầu vào
- Lớp cuối cùng được gọi là Lớp đầu ra
- Tất cả các lớp ở giữa được gọi là Lớp ẩn. Từ sâu có nghĩa là mạng nối các nơ-ron thành nhiều hơn hai lớp.

Mỗi lớp Ẩn bao gồm các nơ-ron. Các tế bào thần kinh được kết nối với nhau. Tế bào thần kinh sẽ xử lý và sau đó truyền tín hiệu đầu vào mà nó nhận được ở lớp phía trên nó. Cường độ của tín hiệu được cung cấp cho nơ-ron ở lớp tiếp theo phụ thuộc vào trọng số, độ lệch và hàm kích hoạt.
Mạng sử dụng một lượng lớn dữ liệu đầu vào và vận hành chúng thông qua nhiều lớp; mạng có thể tìm hiểu các tính năng ngày càng phức tạp của dữ liệu ở mỗi lớp.
Quá trình học sâu
Mạng lưới thần kinh sâu cung cấp độ chính xác cao nhất trong nhiều tác vụ, từ phát hiện đối tượng đến nhận dạng giọng nói. Họ có thể học một cách tự động mà không cần phải có kiến thức định sẵn được lập trình viên mã hóa rõ ràng.
Để nắm bắt ý tưởng về học sâu, hãy tưởng tượng một gia đình, có một đứa trẻ sơ sinh và cha mẹ. Đứa trẻ mới biết đi chỉ các vật thể bằng ngón tay út của mình và luôn nói từ 'mèo'. Vì cha mẹ lo lắng về việc học của con, họ liên tục nói với con rằng 'Đúng, đó là mèo' hoặc 'Không, đó không phải là mèo'. Đứa trẻ sơ sinh vẫn tiếp tục chỉ các vật thể nhưng trở nên chính xác hơn với từ 'mèo'. Đứa trẻ nhỏ, sâu thẳm bên trong, không biết tại sao mình có thể nói đó là mèo hay không. Bé vừa học cách phân cấp các đặc điểm phức tạp khi nghĩ ra một con mèo bằng cách nhìn vào toàn bộ con vật cưng và tiếp tục tập trung vào các chi tiết như đuôi hoặc mũi trước khi đưa ra quyết định.
Mạng nơ-ron hoạt động khá giống nhau. Mỗi lớp biểu diễn một cấp độ kiến thức sâu hơn, tức là hệ thống phân cấp kiến thức. Mạng nơ-ron có bốn lớp sẽ học được tính năng phức tạp hơn so với mạng có hai lớp.
Quá trình học tập diễn ra theo hai giai đoạn:
Giai đoạn đầu: Giai đoạn đầu tiên bao gồm việc áp dụng phép biến đổi phi tuyến của đầu vào và tạo mô hình thống kê làm đầu ra.
Giai đoạn thứ hai: Giai đoạn thứ hai nhằm mục đích cải thiện mô hình bằng phương pháp toán học được gọi là đạo hàm.
Mạng lưới thần kinh lặp lại hai giai đoạn này hàng trăm đến hàng nghìn lần cho đến khi đạt đến mức độ chính xác có thể chấp nhận được. Sự lặp lại của hai giai đoạn này được gọi là sự lặp lại.
Để đưa ra một ví dụ về Deep learning, hãy xem chuyển động bên dưới, người mẫu đang cố gắng học cách nhảy. Sau 10 phút huấn luyện, người mẫu không biết nhảy và trông giống như một nét vẽ nguệch ngoạc.
Sau 48 giờ học, máy tính đã thành thạo nghệ thuật khiêu vũ.
Phân loại mạng lưới thần kinh
Mạng lưới thần kinh nông: Mạng thần kinh Shallow chỉ có một lớp ẩn giữa đầu vào và đầu ra.
Mạng nơron sâu: Mạng lưới thần kinh sâu có nhiều hơn một lớp. Ví dụ: mô hình Google LeNet để nhận dạng hình ảnh có 22 lớp.
Ngày nay, deep learning được sử dụng theo nhiều cách như ô tô không người lái, điện thoại di động, Công cụ tìm kiếm Google, Phát hiện gian lận, TV, v.v.
Các loại mạng học sâu
Bây giờ trong hướng dẫn về mạng Deep Neural này, chúng ta sẽ tìm hiểu về các loại Mạng Deep Learning:
Mạng nơ-ron chuyển tiếp nguồn cấp dữ liệu
Loại mạng nơ-ron nhân tạo đơn giản nhất. Với loại kiến trúc này, thông tin chỉ chảy theo một hướng, về phía trước. Điều đó có nghĩa là, luồng thông tin bắt đầu ở lớp đầu vào, đi đến các lớp "ẩn" và kết thúc ở lớp đầu ra. Mạng
không có vòng lặp. Thông tin dừng lại ở các lớp đầu ra.
Mạng nơron lặp lại (RNN)
RNN là một mạng nơ-ron nhân tạo có nhiều lớp có thể lưu trữ thông tin trong các nút ngữ cảnh, cho phép nó học các chuỗi dữ liệu và đưa ra một số hoặc một chuỗi khác. Nói một cách đơn giản, đó là một mạng nơ-ron nhân tạo có các kết nối giữa các nơ-ron bao gồm các vòng lặp. RNN rất phù hợp để xử lý các chuỗi đầu vào.
Ví dụ: nếu nhiệm vụ là dự đoán từ tiếp theo trong câu “Bạn có muốn một…………?
- Các tế bào thần kinh RNN sẽ nhận được tín hiệu chỉ điểm bắt đầu của câu.
- Mạng nhận từ “Do” làm đầu vào và tạo ra một vectơ số. Vectơ này được đưa trở lại nơron để cung cấp bộ nhớ cho mạng. Giai đoạn này giúp mạng ghi nhớ rằng nó đã nhận được “Do” và nó đã nhận được nó ở vị trí đầu tiên.
- Mạng sẽ tương tự tiến hành các từ tiếp theo. Nó cần từ “bạn” và “muốn”. Trạng thái của các nơ-ron được cập nhật khi nhận được từng từ.
- Giai đoạn cuối cùng xảy ra sau khi nhận được từ “a”. Mạng lưới thần kinh sẽ cung cấp xác suất cho mỗi từ tiếng Anh có thể được sử dụng để hoàn thành câu. Một RNN được đào tạo tốt có thể gán xác suất cao cho “café”, “đồ uống”, “burger”, v.v.
Các ứng dụng phổ biến của RNN
- Giúp người giao dịch chứng khoán tạo báo cáo phân tích
- Phát hiện bất thường trong hợp đồng báo cáo tài chính
- Phát hiện giao dịch thẻ tín dụng gian lận
- Cung cấp chú thích cho hình ảnh
- Chatbots mạnh mẽ
- Việc sử dụng RNN tiêu chuẩn xảy ra khi người thực hành đang làm việc với dữ liệu hoặc chuỗi thời gian (ví dụ: bản ghi âm hoặc văn bản).
Mạng nơ-ron hợp pháp (CNN)
CNN là mạng nơ-ron nhiều lớp có kiến trúc độc đáo được thiết kế để trích xuất các tính năng ngày càng phức tạp của dữ liệu ở mỗi lớp để xác định đầu ra. CNN rất phù hợp cho các nhiệm vụ nhận thức.
CNN chủ yếu được sử dụng khi có tập dữ liệu phi cấu trúc (ví dụ: hình ảnh) và người thực hành cần trích xuất thông tin từ nó.
Ví dụ: nếu nhiệm vụ là dự đoán chú thích hình ảnh:
- CNN nhận được một hình ảnh chẳng hạn như một con mèo, hình ảnh này, theo thuật ngữ máy tính, là một tập hợp các pixel. Nói chung, một lớp cho ảnh thang độ xám và ba lớp cho ảnh màu.
- Trong quá trình học tính năng (tức là các lớp ẩn), mạng sẽ xác định các tính năng độc đáo, chẳng hạn như đuôi mèo, tai, v.v.
- Khi mạng học kỹ lưỡng cách nhận dạng một hình ảnh, nó có thể cung cấp xác suất cho mỗi hình ảnh mà nó biết. Nhãn có xác suất cao nhất sẽ trở thành dự đoán của mạng.
Học tăng cường
Học tăng cường là một trường con của học máy trong đó các hệ thống được đào tạo bằng cách nhận “phần thưởng” hoặc “hình phạt” ảo, về cơ bản là học bằng cách thử và sai. DeepMind của Google đã sử dụng phương pháp học tăng cường để đánh bại một nhà vô địch là con người trong trò chơi cờ vây. Học tăng cường cũng được sử dụng trong trò chơi điện tử để cải thiện trải nghiệm chơi trò chơi bằng cách cung cấp các bot thông minh hơn.
Một trong những thuật toán nổi tiếng nhất là:
- Q-học tập
- Mạng Q sâu
- Trạng thái-Hành động-Phần thưởng-Trạng thái-Hành động (SARSA)
- Độ dốc chính sách xác định sâu (DDPG)
Ví dụ về các ứng dụng học sâu
Bây giờ trong hướng dẫn Deep learning dành cho người mới bắt đầu này, hãy cùng tìm hiểu về các ứng dụng Deep Learning:
AI trong tài chính
Lĩnh vực công nghệ tài chính đã bắt đầu sử dụng AI để tiết kiệm thời gian, giảm chi phí và gia tăng giá trị. Học sâu đang thay đổi ngành cho vay bằng cách sử dụng tính năng chấm điểm tín dụng mạnh mẽ hơn. Những người ra quyết định tín dụng có thể sử dụng AI cho các ứng dụng cho vay tín dụng mạnh mẽ để đạt được đánh giá rủi ro nhanh hơn, chính xác hơn, sử dụng trí thông minh của máy để xác định tính cách và năng lực của người nộp đơn.
Underwrite là một công ty Fintech cung cấp giải pháp AI cho các công ty sản xuất tín dụng. underwrite.ai sử dụng AI để phát hiện người nộp đơn nào có nhiều khả năng trả lại khoản vay hơn. Cách tiếp cận của họ hoàn toàn vượt trội so với các phương pháp truyền thống.
AI trong nhân sự
Under Armour, một công ty đồ thể thao đã cách mạng hóa việc tuyển dụng và hiện đại hóa trải nghiệm của ứng viên với sự trợ giúp của AI. Trên thực tế, Under Armour đã giảm thời gian tuyển dụng cho các cửa hàng bán lẻ của mình xuống 35%. Under Armour đã phải đối mặt với sự quan tâm ngày càng tăng của công chúng vào năm 2012. Trung bình, họ có 30000 bản lý lịch mỗi tháng. Việc đọc tất cả các đơn đăng ký đó và bắt đầu quá trình sàng lọc và phỏng vấn mất quá nhiều thời gian. Quá trình dài để tuyển dụng và đưa mọi người vào làm việc đã ảnh hưởng đến khả năng của Under Armour trong việc có đủ nhân viên, tăng tốc và sẵn sàng hoạt động tại các cửa hàng bán lẻ của họ.
Vào thời điểm đó, Under Armor đã có sẵn tất cả công nghệ nhân sự 'phải có', chẳng hạn như các giải pháp giao dịch để tìm nguồn cung ứng, ứng tuyển, theo dõi và đào tạo nhưng những công cụ đó không đủ hữu ích. Chọn dưới áo giáp HireVue, nhà cung cấp AI cho giải pháp nhân sự, cho cả phỏng vấn theo yêu cầu và phỏng vấn trực tiếp. Kết quả thật là lừa đảo; họ đã giảm được 35% thời gian lấp đầy. Đổi lại, họ thuê được nhân viên có chất lượng cao hơn.
AI trong tiếp thị
AI là một công cụ có giá trị cho các thách thức về quản lý dịch vụ khách hàng và cá nhân hóa. Cải thiện khả năng nhận dạng giọng nói trong quản lý trung tâm cuộc gọi và định tuyến cuộc gọi nhờ ứng dụng kỹ thuật AI mang lại trải nghiệm liền mạch hơn cho khách hàng.
Ví dụ: phân tích âm thanh deep learning cho phép hệ thống đánh giá giai điệu cảm xúc của khách hàng. Nếu khách hàng phản ứng kém với Chatbot AI, hệ thống có thể được định tuyến lại cuộc trò chuyện đến những người điều hành thực sự là con người để xử lý vấn đề.
Ngoài ba ví dụ về Deep learning ở trên, AI còn được sử dụng rộng rãi trong các lĩnh vực/ngành công nghiệp khác.
Tại sao Học sâu lại quan trọng?
Học sâu là một công cụ mạnh mẽ để biến dự đoán thành kết quả có thể thực hiện được. Học sâu vượt trội trong việc khám phá mẫu (học không giám sát) và dự đoán dựa trên kiến thức. Lớn dữ liệu là nhiên liệu cho việc học sâu. Khi cả hai kết hợp, một tổ chức có thể đạt được những kết quả chưa từng có về năng suất, doanh số, quản lý và đổi mới.
Học sâu có thể vượt trội hơn phương pháp truyền thống. Chẳng hạn, thuật toán học sâu có độ chính xác cao hơn 41% so với thuật toán học máy trong phân loại hình ảnh, chính xác hơn 27% trong nhận dạng khuôn mặt và 25% trong nhận dạng giọng nói.
Hạn chế của học sâu
Bây giờ trong hướng dẫn về Mạng thần kinh này, chúng ta sẽ tìm hiểu về những hạn chế của Deep Learning:
Ghi nhãn dữ liệu
Hầu hết các mô hình AI hiện nay đều được đào tạo thông qua “học có giám sát”. Điều đó có nghĩa là con người phải gắn nhãn và phân loại dữ liệu cơ bản, đây có thể là một công việc khá lớn và dễ xảy ra lỗi. Ví dụ: các công ty phát triển công nghệ xe tự lái đang thuê hàng trăm người để chú thích thủ công hàng giờ nguồn cấp dữ liệu video từ các phương tiện nguyên mẫu để giúp đào tạo các hệ thống này.
Có được bộ dữ liệu đào tạo khổng lồ
Người ta đã chứng minh rằng trong một số trường hợp, các kỹ thuật học sâu đơn giản như CNN có thể bắt chước kiến thức của các chuyên gia trong y học và các lĩnh vực khác. Làn sóng hiện tại của học máytuy nhiên, yêu cầu các tập dữ liệu huấn luyện không chỉ được gắn nhãn mà còn đủ rộng và phổ quát.
Các phương pháp học sâu yêu cầu hàng nghìn lượt quan sát để các mô hình có thể thực hiện tương đối tốt các nhiệm vụ phân loại và trong một số trường hợp là hàng triệu lượt quan sát để chúng thực hiện ở cấp độ con người. Không có gì ngạc nhiên khi deep learning rất nổi tiếng ở các công ty công nghệ khổng lồ; họ đang sử dụng dữ liệu lớn để tích lũy hàng petabyte dữ liệu. Nó cho phép họ tạo ra một mô hình deep learning ấn tượng và có độ chính xác cao.
Giải thích một vấn đề
Các mô hình lớn và phức tạp có thể khó giải thích theo thuật ngữ của con người. Ví dụ, tại sao một quyết định cụ thể lại được đưa ra. Đây là một lý do khiến việc chấp nhận một số công cụ AI chậm trong các lĩnh vực ứng dụng mà khả năng diễn giải là hữu ích hoặc thực sự cần thiết.
Hơn nữa, khi ứng dụng AI mở rộng, các yêu cầu pháp lý cũng có thể thúc đẩy nhu cầu về các mô hình AI dễ giải thích hơn.
Tổng kết
Tổng quan về học sâu: Học sâu là công nghệ tiên tiến mới dành cho trí tuệ nhân tạo. Kiến trúc học sâu bao gồm một lớp đầu vào, các lớp ẩn và một lớp đầu ra. Từ sâu có nghĩa là có nhiều hơn hai lớp được kết nối đầy đủ.
Có rất nhiều mạng nơ-ron, trong đó mỗi kiến trúc được thiết kế để thực hiện một nhiệm vụ nhất định. Ví dụ, CNN hoạt động rất tốt với hình ảnh, RNN cung cấp kết quả ấn tượng với chuỗi thời gian và phân tích văn bản.
Học sâu hiện đang hoạt động trong các lĩnh vực khác nhau, từ tài chính đến tiếp thị, chuỗi cung ứng và tiếp thị. Các công ty lớn là những người đầu tiên sử dụng deep learning vì họ đã có sẵn một lượng lớn dữ liệu. Học sâu đòi hỏi phải có một tập dữ liệu đào tạo mở rộng.