BERT là gì? Cách Google / SERPs định hướng phát triển thuật toán

Mất bao lâu để ranking trên top10 - trang 1? Nên SEO trong bao lâu?
Mất bao lâu để ranking trên top10 – trang 1? Nên SEO trong bao lâu?
October 16, 2020
Tại sao WordPress Update 5.6 có khả năng làm hỏng Website của bạn?
Update WordPress 5.6 và khả năng sẽ gặp lỗi – 11/2020
November 9, 2020
Show all
BERT là gì? Cách Google / SERPs định hướng phát triển thuật toán

BERT là gì? Cách Google / SERPs định hướng phát triển thuật toán

Google ra mắt DeepRank vào năm 2017, đây là tên mã nội bộ cho sự ra mắt của thuật toán hiểu ngôn ngữ người dùng BERT. Vậy BERT là gì?

BERT là gì? Cách Google / SERPs định hướng phát triển thuật toán

BERT là gì? Cách Google / SERPs định hướng phát triển thuật toán

Chia sẻ của Search Engine Land về DeepRank/BERT như thế nào?

Trước thực trạng tìm kiếm về BERT là gì của cộng đồng SEO Specialist, Search Engine Land đã có một số chia sẻ của họ như sau. Bài viết được Barry Schwartz chia sẻ vào ngày 3 tháng 11 năm 2020

Một vài tuần trước, Google đã phát hành một bộ phim xuất sắc về cách hoạt động của tìm kiếm. Đây là bộ phim, cuộc thảo luận xung quanh DeepRank, tức là BERT bắt đầu ở khoảng 42 phút trong video. Nhưng lưu ý, video đã được quay trước COVID theo người phát ngôn của Google. Ngoài ra, bạn có thể thấy đề cập trong video rằng DeepRank (hay còn gọi là BERT) đã nhận được phê duyệt ra mắt và như bạn đã biết, đã phát hành trực tuyến vào tháng 10 năm 2019.

Tôi rất khuyến khích các bạn tìm hiểu về SEO nên xem bởi trong video này nhắc đến việc Google khởi chạy BERT, được gọi nội bộ là dự án DeepRank.

DeepRank đang hoạt động – đây là điều không thể bàn cãi. Nói rõ hơn, DeepRank đã nhận được “sự chấp thuận ra mắt” từ Google và đã xuất hiện trên Google Tìm kiếm từ tháng 10 năm 2019. Người phát ngôn của Google đã xác nhận hôm nay rằng

“DeepRank was the internal code name for the BERT launch we announced in October 2019.”

Vì vậy, khi BERT ra mắt vào tháng 10 năm 2019, DeepRank đã ra mắt. DeepRank và BERT đều giống nhau. Trên thực tế, DeepRank được tham chiếu trở lại một bài báo năm 2017 của Google.

DeepRank đã hoạt động hoàn toàn. Trong khi DeepRank / BERT ra mắt ban đầu cho 10% truy vấn, vào năm sau, BERT được sử dụng trong hầu như tất cả các truy vấn. Vì vậy, DeepRank không chỉ hoạt động mà còn trực tiếp cho hầu hết mọi truy vấn mà người tìm kiếm thực hiện.

Tại sao bạn nên quan tâm? Đã có một số báo cáo rằng một cái gì đó mới có tên là DeepRank đang được sản xuất tại Google và sẽ xuất hiện vào một thời điểm nào đó. Điều đó là không chính xác. DeepRank đã hoạt động được hơn một năm và được chứng minh là hoạt động rất tốt cho Google.

Biết được các mốc thời gian và sự ra mắt đôi khi có thể giúp các SEO và nhà tiếp thị hiểu được các xu hướng và thay đổi tại Google. Mặc dù bạn không thể tối ưu hóa cho BERT, hay còn gọi là DeepRank, nhưng biết khi nào nó được khởi chạy là một điểm tham khảo quan trọng.

BERT / DeepRank là gì?

Dưới đây là một số chia sẻ của MOZ.com về BERT là gì?

BERT là một mô hình xử lý ngôn ngữ tự nhiên không giám sát được đào tạo trước. BERT có thể làm tốt hơn 11 nhiệm vụ NLP (Natural Language Processing) phổ biến nhất sau khi tinh chỉnh. Về cơ bản đây là một bước tiến lớn cho việc công cụ Xử lý và Hiểu ngôn ngữ tự nhiên (Natural Language Processing and Understanding).

BERT có tính hai chiều sâu sắc: Nó xem xét các từ trước và sau các thực thể và ngữ cảnh được đào tạo trước trên Wikipedia để cung cấp hiểu biết phong phú hơn về ngôn ngữ.

Tại sao BERT thông minh hơn các NLP hiện nay?

Google đã lấy văn bản trên Wikipedia và rất nhiều tiền cho sức mạnh tính toán (TPU mà họ tập hợp lại trong một pod V3) có thể cung cấp dữ liệu cho các mô hình lớn này. Sau đó, họ sử dụng một mạng thần kinh không được giám sát để đào tạo từ tất cả văn bản của Wikipedia để hiểu rõ hơn về ngôn ngữ và ngữ cảnh.

Điều thú vị về cách nó học là nó có độ dài văn bản tùy ý bất kỳ (điều này tốt vì ngôn ngữ khá tùy ý trong cách chúng ta nói) và nó chuyển nó thành một vector. Vectơ là một chuỗi số cố định. Điều này giúp ngôn ngữ có thể được dịch sang máy.

Điều này xảy ra trong một không gian n chiều thực sự hoang dã mà chúng ta thậm chí không thể tưởng tượng được. Đưa ngôn ngữ theo ngữ cảnh tương tự vào các khu vực giống nhau.

Để có được BERT thông minh hơn và thông minh hơn, tương tự như Word2vec, hãy sử dụng một chiến thuật gọi là Masking. BERT là một mô hình hai chiều nhìn vào các từ trước và sau từ ẩn để giúp dự đoán từ đó là gì.

Chia sẻ của Search Engine Land về DeepRank/BERT như thế nào?

Masking xảy ra khi một từ ngẫu nhiên trong câu bị ẩn.

Nó làm điều này lặp đi lặp lại cho đến khi nó mạnh mẽ trong việc dự đoán các từ bị Masking. Sau đó, nó có thể được tinh chỉnh thêm để thực hiện 11 tác vụ xử lý ngôn ngữ tự nhiên phổ biến nhất. Thực sự, thực sự thú vị và một thời gian vui vẻ khi ở trong không gian này.

BERT có phải toàn diện? Điểm yếu của BERT là gì?

Allyson Ettinger đã viết bài báo nghiên cứu thực sự tuyệt vời này có tên là “What BERT Can’t Do”. Điều đáng ngạc nhiên nhất từ nghiên cứu của cô ấy là lĩnh vực chẩn đoán phủ định này, có nghĩa là BERT không giỏi trong việc hiểu về phủ định hoặc những thứ không phải vậy. Ví dụ, khi đầu vào với Robin là một… Nó dự đoán con chim, điều đó đúng, điều đó thật tuyệt. Nhưng khi nhập vào Robin không phải là… Nó cũng là loài chim tiên đoán. Vì vậy, trong trường hợp BERT không nhìn thấy các ví dụ hoặc ngữ cảnh phủ định, nó vẫn sẽ gặp khó khăn khi hiểu điều đó. Có rất nhiều điều thực sự thú vị trong nghiên cứu của Allyson, rất khuyên bạn nên xem qua.

BERT có phải toàn diện? Điểm yếu của BERT là gì?

BERT có phải toàn diện? Điểm yếu của BERT là gì?

Làm thế nào để tối ưu SEO đáp ứng nhu cầu BERT?

Cuối cùng, làm thế nào để bạn tối ưu hóa cho BERT? Một lần nữa, bạn không thể. Cách duy nhất để cải thiện trang web của bạn với bản cập nhật này là viết nội dung thực sự tuyệt vời cho người dùng của bạn và thực hiện ý định mà họ đang tìm kiếm.

“CONTENT IS KING” – Đây là thứ mà Google luôn hướng tới cũng như các SEO luôn lấy làm trọng tâm.

Một nguồn tuyệt vời để giúp bạn hiểu và viết tốt hơn cho NLP là bài viết SEO On-page cho NLP của Briggsby: https://www.briggsby.com/on-page-seo-for-nlp

Lý do nên hiểu về BERT là gì?

Khả năng hiểu câu hỏi tự nhiên ngày càng tăng của Google, một điều tôi phải đề cập đến bởi vì tôi thực sự quan tâm đến bài phát biểu này của Jeff Dean của Google:

Anh ấy đang nói về BERT và sau đó đi vào câu hỏi tự nhiên và hiểu câu hỏi tự nhiên. Bài học kinh nghiệm lớn đối với tôi qua ví dụ này: Giả sử ai đó đã đặt câu hỏi, “bạn có thể thực hiện và nhận cuộc gọi ở chế độ trên máy bay không?”

Screenshot từ Deep Learning for Solving Important Problems Keynote by Jeff Dean.

Screenshot từ Deep Learning for Solving Important Problems Keynote by Jeff Dean.

Khối văn bản trong đó lớp dịch ngôn ngữ tự nhiên của Google đang cố gắng hiểu tất cả văn bản này rất kỹ thuật và khó hiểu:

Chế độ trên máy bay, chế độ trên máy bay, chế độ máy bay, chế độ ngoại tuyến hoặc chế độ độc lập là cài đặt có sẵn trên nhiều điện thoại thông minh, máy tính xách tay và các thiết bị điện tử khác, khi được kích hoạt, thiết bị sẽ tạm ngừng truyền tín hiệu tần số vô tuyến, do đó vô hiệu hóa Bluetooth, điện thoại và Wi-Fi. GPS có thể bị tắt hoặc có thể không, vì nó không liên quan đến việc truyền sóng vô tuyến.

Với những lớp này và tận dụng những thứ như BERT, họ có thể trả lời “Không” trong tất cả ngôn ngữ rất phức tạp, dài và khó hiểu này. Nó thực sự, thực sự mạnh mẽ trong không gian của chúng ta.

Tổng kết BERT là gì?

Cân nhắc những thứ như đoạn trích nổi bật; xem xét những thứ như tính năng SERP. Điều này có thể bắt đầu có tác động rất lớn trong không gian của chúng ta. Vì vậy, tôi nghĩ điều quan trọng là phải nắm bắt được thông tin về nơi mà tất cả đang hướng đến và những gì đang diễn ra trong lĩnh vực này.

Tôi thực sự hy vọng bạn thích phiên bản Whiteboard Friday này. Vui lòng cho tôi biết nếu bạn có bất kỳ câu hỏi hoặc nhận xét nào ở bên dưới và tôi mong được gặp lại tất cả các bạn lần sau. Cám ơn rất nhiều.

Bài viết sưu tầm

Hãy để lại đánh giá của bạn

Đánh giá: 5 / 5. Số lượt: 1

datddd
datddd
Là một chuyên gia SEO, tôi quan tâm đến hiệu suất chuyển đổi cho khách hàng thông qua quá trình tối ưu SEO Website

1 Comment

  1. NghiemVo says:

    Bài viết hay quá

Leave a Reply

Your email address will not be published. Required fields are marked *