Gary Illyes của Google cho chúng ta biết Google có thể sử dụng máy học với các tín hiệu tổng hợp lại với nhau cho chất lượng tìm kiếm tốt hơn, và với RankBrain.
Một trong những từ thông dụng nhất trên Google và các thị trường công nghệ tổng thể là máy học. Google sử dụng nó với RankBrain cho tìm kiếm và theo những cách khác. Chúng tôi hỏi Gary Illyes từ Google trong phần hai của cuộc phỏng vấn của chúng tôi như thế nào Google sử dụng máy học với tìm kiếm.
Illyes nói rằng Google sử dụng chủ yếu cho "đến với các tín hiệu mới và quy tụ tín hiệu." Vì vậy, họ có thể nhìn vào hai hoặc nhiều tín hiệu không phải máy học hiện có và xem nếu máy thêm việc học tập hợp của chúng có thể giúp cải thiện tìm kiếm bảng xếp hạng và chất lượng.
Ông cũng cho biết, "RankBrain, nơi ... mà lại cấp bậc dựa trên dựa trên tín hiệu tích lịch sử," là một cách khác để họ sử dụng máy tính học tập, và sau đó giải thích cách làm việc RankBrain và Penguin không thực sự sử dụng máy học.
Dưới đây là toàn bộ bản dịch:
Danny Sullivan: Những ngày này có vẻ như nó là thực sự mát mẻ cho người dân để chỉ nói học máy đang được sử dụng trong tất cả mọi thứ.
Gary Illyes: Và sau đó mọi người lăn tăn.
Danny Sullivan: Yeah. nó là gì, bạn đang làm gì với máy tính học tập? Giống như, vì vậy khi bạn nói nó không được sử dụng trong thuật toán lõi. Vì vậy, không có một người bị sa thải. Các máy đã không được thực hiện trên các thuật toán, các bạn vẫn đang sử dụng một thuật toán. Bạn vẫn có những người cố gắng tìm ra cách tốt nhất để xử lý tín hiệu, và sau đó bạn sẽ làm gì với máy tính học tập; là [nó] phần nào đó?
Gary Illyes: Họ thường được sử dụng cho đến với tín hiệu mới và quy tụ tín hiệu. Vì vậy, về cơ bản, chúng ta hãy nói rằng đây là một ví dụ ngẫu nhiên và không biết nếu điều này là có thật, nhưng chúng ta hãy nói rằng tôi muốn xem nếu kết hợp PageRank với Panda và bất cứ điều gì khác, tôi không biết, tần số token.
Nếu kết hợp ba trong một cách nào đó sẽ dẫn đến thứ hạng tốt hơn, và cho rằng ví dụ, chúng ta có thể dễ dàng sử dụng máy học. Và sau đó tạo ra các tín hiệu hỗn hợp mới. Đó sẽ là một ví dụ.
Các ví dụ khác sẽ được RankBrain, nơi ... mà lại cấp bậc dựa trên dựa trên tín hiệu tích lịch sử.
Nhưng đó cũng là, nếu bạn, nếu bạn nghĩ về nó, nó cũng là một tín hiệu composite.
Đó là sử dụng một số tín hiệu để đến với một số nhân mới cho các kết quả đó đã được xếp hạng bởi các thuật toán lõi.
Những gì người khác?
Barry Schwartz: Không bạn lần đầu tiên sử dụng nó như là một sàng lọc truy vấn? Đúng? Đó là điều chính?
Gary Illyes: Tôi không biết ...?
Barry Schwartz: Không phải tất cả RankBrain về một số loại thức truy vấn và ...
Gary Illyes: Vâng, làm cho chắc chắn rằng cho truy vấn chúng tôi là kết quả tốt nhất có thể, về cơ bản, nó được tái xếp hạng trong một cách.
Barry Schwartz: Danny, bạn có hiểu RankBrain để có nghĩa là, có thể nó đã chỉ cho tôi, có nghĩa là, được rồi ai đó tìm kiếm X, nhưng RankBrain thực sự làm cho [nó] vào Xish? Và sau đó truy vấn sẽ là kết quả.
Danny Sullivan: Khi lần đầu tiên ra mắt, sự hiểu biết của tôi là [rằng] RankBrain đã được sử dụng cho các truy vấn đuôi dài tương ứng với họ câu trả lời ngắn ngắn. Vì vậy, ai đó xuất hiện và nói: Tại sao là thủy triều cao siêu đôi khi, khi tôi không hiểu - mặt trăng dường như là rất lớn, và đó là một câu hỏi rất bất thường, phải không? Và Google có thể đi, OK, có rất nhiều xảy ra ở đây. Làm thế nào để giải nén này và đến nơi, và sau đó nhận được sự tin tưởng và sử dụng vật điển hình mà bạn muốn được như thế, OK, chúng ta sẽ thấy nếu chúng ta có tất cả những từ bạn có một liên kết đến bất cứ điều gì. Trong khi đó, thực sự những gì người đang nói là tại sao là cao triều khi trăng tròn. Và đó là một truy vấn phổ biến hơn. Và Google có lẽ đã tự tin hơn nhiều trong những gì nó đang đứng khi nó đề với điều đó, và sự hiểu biết của tôi [là] RankBrain giúp Google hiểu rõ hơn rằng các truy vấn dài hơn coresponded cơ bản để các truy vấn ngắn nơi nó đã có rất nhiều sự tự tin về các câu trả lời.
Đó là sau đó, mà là giống như những gì, một năm trước đây hay như vậy? Tại thời điểm này, Gary, khi bạn bắt đầu nói rằng tái xếp hạng, đó là các loại tái cấp bạn đang nói về?
Gary Illyes: Yeah.
Danny Sullivan: OK.
Barry Schwartz: Tất cả các quyền. Vì vậy, chúng ta không nên phân loại tất cả những điều này như RankBrain, hoặc nếu chúng tôi? Giống như nó có thể là máy học tập khác.
Gary Illyes: RankBrain là một thành phần trong hệ thống xếp hạng của chúng tôi. Hiện có hơn 200, như chúng tôi đã nói ở phần đầu, tín hiệu mà chúng tôi sử dụng và những gì mỗi người trong số họ có thể trở nên giống như máy học tập dựa trên.
Nhưng khi bạn hoặc tôi không hy vọng rằng trong thời gian tới hoặc trong tương lai gần tất cả trong số họ sẽ trở thành học máy dựa. Hoặc đó là những gì chúng ta gọi là thuật toán lõi sẽ trở thành máy học tập dựa trên. Lý do chính cho điều đó là các quyết định học máy gỡ lỗi hoặc quyết định AI, nếu bạn muốn, nếu bạn thích, là vô cùng khó khăn, đặc biệt là khi bạn có ... nhiều lớp mạng nơron. Nó trở nên gần như không thể gỡ lỗi một quyết định. Và đó là rất xấu đối với chúng tôi. Và cho rằng chúng tôi cố gắng phát triển những cách thức mới để theo dõi lại các quyết định. Nhưng nếu nó có thể dễ dàng làm khó hiểu vấn đề, và đó sẽ hạn chế của chúng tôi với khả năng của chúng tôi để cải thiện tìm kiếm nói chung.
Barry Schwartz: Vì vậy, khi người ta nói Penguin tại là một máy cũ học tập dựa trên ...
Gary Illyes: Penguin không phải là ML.
Barry Schwartz: OK, có rất nhiều người nói rằng Penguin [là] máy học tập dựa trên.
Gary Illyes: Tất nhiên họ làm. Tôi có nghĩa là nếu bạn nghĩ về nó, đó là một từ rất sexy. Đúng. Và nếu bạn xuất bản nó ...
Danny Sullivan: Số người sử dụng nó trong các quán bar và trực tuyến tất cả các thời gian. Giống như hey, máy học. Oh yeah.
Gary Illyes: Nhưng về cơ bản, nếu bạn xuất bản một bài viết với tiêu đề như máy học hiện đang ở Penguin hay Penguin tạo ra bởi máy học tập nó giống như .... Nhưng nếu bạn xuất bản một bài viết với tiêu đề là nó có nhiều khả năng mà mọi người có thể click vào tiêu đề đó, và tốt, có thể đi lên với những ý tưởng mà bạn đang điên hay một cái gì đó như thế. Nhưng nó có nhiều khả năng họ sẽ ghé thăm trang web của bạn hơn.
Nguồn: http://searchengineland.com/google-uses-machine-learning-search-algorithms-261158