Pages

Thứ Sáu, 22 tháng 1, 2016

Những kiến thức về thu thập dữ liệu đối mang SEO

0 nhận xét

nếu công cụ tìm kiếm không thể thu thập dữ liệu website của bạn hoặc lập chỉ mục các trang của bạn thì phần nội dung sẽ ko mang chuyển biến nào cả. Thậm chí bạn có thể tạo ra số lượng lớn backlink nhưng vẫn bị mắc kẹt trong đám bùn lầy.

một số website hơi thuận lợi trong việc thu thập dữ liệu. Ý của tôi là, trường hợp website của bạn là website tĩnh, và được xây dựng bằng bí quyết thức đơn giản (WordPress cộng mang 1 vài plugin?), bạn sẽ không gặp vấn đề gì. Tuy nhiên, trong nhiều nếu đặc thù, website cũng gặp cạnh tranh trong việc lập chỉ mục tuyệt vời.

Nghiên cứu tình huống

vừa qua, doanh nghiệp của tôi với 1 người mua mới, người làm các phân tích ban đầu của chúng tôi đều bị ảnh hưởng bởi sự trở lại của Google Panda vào tháng 2/2011. Dấu hiệu của việc này tương đối rõ ràng:

slide

nhiều năm qua, khách hàng của tôi xác định sẽ đi theo "kinh doanh thông thường", không phải là SEO với quá rộng rãi suy nghĩ và cân kể. Họ vẫn tạo ra tiền bạc thông qua việc buôn bán chính họ qua PPC, email và những phương tiện truyền thống khác.

Họ xác định rằng ấy là thời gian để bắt kịp sở hữu những người khác và hiến dâng thời gian, tiền bạc và sự kiên nhẫn cho quá trình khôi phục sự hiện diện của sắm kiếm khi không.

những website đặc biệt như website thương mại điện tử, trong ấy xảy ra việc mọi người bán lại những sản phẩm; sự mô tả về sản phẩm được chia sẻ giữa những người bán lại những sản phẩm giống nhau này. "Quá dễ dàng rồi", chúng tôi nghĩ vậy… chúng tôi sẽ viết lại 1 loạt những mô tả sản phẩm và vững mạnh việc logic hóa kết quả.

không quá nhanh

lúc tôi chắc chắn về các điều bạn cần làm cho, chúng tôi đã có "kiểm nghiệm". Chúng tôi muốn tạo dựng quan điểm tổng thể, nhằm bảo đảm sở hữu một bí quyết chiến lược để thực hiện. đó cũng là lúc chúng tôi phát hiện ra danh sách dài lê thê của những trục trặc khoa học, những lỗi, sự chuyển hướng, và điều đó hướng chúng tôi đến việc buộc phải nên mua hiểu sâu sắc hơn nữa trong thu thập thông tin và lập chỉ mục.

"Hãy đặt các điều đầu tiên ở vị trí đầu tiên", họ đề cập vậy.

dùng công cụ Wayback Machine, chúng ta sở hữu thể xem xét lại website, từ tháng 12/2010 tới 02/2011 (phân tích đa số dữ liệu đã bị mất vào khoảng thời gian trên; tạo điều kiện cho các nhà tăng trưởng web sở hữu thêm tài liệu để nghiên cứu). Đây là bước đầu cho công đoạn sắm hiểu của về các gì chúng ta đã từng lãng quên. 1 số "thiên tài" quyết định rằng họ sẽ viết lại tất cả URL của họ (chèn thư mục, ko có lý do rõ ràng), ngừng tiêu dùng công cụ tìm kiếm cấu trúc URL thân thiện (ví dụ: company.com/category/product/product-name) và khi ấy 302 chuyển hướng tất cả trang bị tới các URL mới này. Điều đấy thật tồi tệ. Sẽ xuất hiện một loạt những phản ứng lại, dẫn tới những thiệt hại và các hoạt động không phải chăng cho SEO.

Chúng tôi sẽ nhanh chóng viết lại bản sao như đã hứa và bỏ qua "kế hoạch game"- chỉ khiến cho tụt dốc và khiến cho vấy bẩn các kĩ thuật SEO.

thứ 1 chúng ta nên xem xem những những robot thu thập thông tin phù hợp với website hay ko.

– Google Webmaster Tool (công cụ quản trị website): trong khi Google Webmaster Tool đã sở hữu một vị trí ưng ý, thì sơ đồ của 1 website (sitemap) lại trở thành lỗi thời. Thay vì tiêu dùng lại 1 sitemap cũ, chúng tôi sẽ tạo ra 1 sitemap mới, phân hạng thành những phần của website mà chúng ta muốn phân tích (phần chính, blog, sản phẩm XYZ, sản phẩm ABC,…). Đây sẽ là điều phải chăng nhất chúng ta đã từng làm cho. Nó sẽ giúp chúng ta cô lập các khu vực của website, phần mà không được lập chỉ mục đầy đủ.

– Phân tích Long File: chúng tôi nghi ngờ rằng các người chuyên đi sao chép nội dung đang nhắm đến website của quý khách của chúng tôi. Việc phân tích 1 log-file đã xác nhận điều này. Chúng tôi mang khả năng để cô lập 1 số IP và phong tỏa việc thu thập thông tin website của chúng. Chúng tôi cũng mong muốn sắm ra tín hiệu mà khiến cho robot gặp khó khăn trong việc thu thập dữ liệu website.

– Phân tích nội dung: bởi vì chúng tôi tin rằng Panda vẫn sẽ hiện hữu và chúng tôi mang khả năng xác nhận được những website sở hữu nội dung sao chép (bị đánh cắp), chúng tôi vẫn phải quan tâm đến những trường hợp cá biệt – đó là việc chúng tôi với thể tạo ra 1 bản sao trong chính website của mình. Trong lúc chẳng dễ dàng gì xác định được các công cụ/thu thập dữ liệu bằng việc xem xét phiên bản bộ nhớ đệm của trang – chúng tôi khẳng định là khó giải quyết, chúng tôi vẫn có khả năng nhận biết quý khách sở hữu nội dung "pop up"đã được lập chỉ mục. Nội dung pop-up này vô cùng quan trọng đối với người dùng (họ sở hữu thể biết được sản phẩm đã hết hàng…) nhưng nội dung này cũng tồn tại trên mỗi trang sản phẩm mà ko phải quan tâm tới việc sản phẩm đã hết hàng hay chưa… Nó đã ở trong bộ nhớ đệm của Google. Tương đương có 1%, nội dung phế liệu này chiếm số lượng lớn. Dĩ nhiên 1 nừa của nội dung văn bản của chúng trên trang web đều liên quan đến nội dung đã hết hàng, hoặc đề cập những khác "không còn ưng ý nữa". Bạn có nghĩ các công cụ tậu kiếm thích điều này không? Bạn sở hữu nghĩ họ muốn lập chỉ mục những trang này không? Chúng ta nghĩ gì? "Cớ lẽ là không".

– Vấn đề DNS: lúc chúng tôi đào bới sâu hơn vào các vấn đề kỹ thuật mang thể xảy ra, chúng tôi muốn sắm xem liệu mang vấn đề DNS nào đối mang tên miền ko. Chúng tôi muốn bảo đảm rằng sẽ ko có bất kì vấn đề nào sở hữu việc thiết lập tên miền cũng như rào cản sẽ xuất hiện lúc site được "gọi tên" và máy chủ phải bắt đầu giao tiếp. Chúng tôi đã sắm ra vấn đề nhỏ tại cấp độ DNSSEC nơi mà phần thiếu thông tin giao tiếp không được chấp nhận. Đây là sự sửa chữa đúng đắn.

Ky thuat SEO -  Tong hop kien thuc ve thu thap du lieu

An ninh cho lỗ hổng XSS: khi thực hiện những truy vấn site trong công cụ tậu kiếm, chúng tôi click vào website của người mua và nhận được 1 tin nhắn rằng website "cannot be trusted" ("không đáng tin"). Chúng tôi quyết định phải buộc phải kiểm tra website dù cho mang bất kì phần mềm độc hại nào. Chúng tôi sử dụng công cụ Zed Attack Proxy. khi nó bắt đầu, website của các bạn thực tế trở về kết quả "positive" (mà nghĩa thực sự của nó là "negative") trong thử nghiệm của chúng tôi. lúc nó hiện ra, nó không phải là XSS nhưng đúng hơn là kết quả "false/positive" lại tùy thuộc phương pháp mà phần mềm của họ thực hiện các nhiệm vụ khác nhau trong chương trình phụ trợ. Hãy cứ suy nghĩ đi… liệu rằng 1 công cụ có thể chỉ ra được vấn đề không, tại sao công cụ chọn kiếm lại ko cho rằng có vấn đề?

Mobile: Vẫn chưa sở hữu sự đồng bộ ở đây lúc các bạn đang dùng ứng dụng mobile và chưa chưa chạy website hồi đáp. Điều này sẽ nhanh chóng diễn ra thôi nhưng chúng ta vẫn đang thực hiện cùng mang ứng dụng mobile của họ cho đến lúc ai đó tiếp cận sở hữu bản đồ với hầu hết những trang (hiện nay, toàn bộ các trang mobile sẽ hướng bạn đến trang chủ lúc họ sở hữu ứng dụng "phù thủy" để đẩy bạn đi qua tiến trinh bán hàng).

Javasript/CSS: người mua đang bị phong tỏa JS và CSS do các robot. Năm ngoái, Google tuyên bố điều này và đây quả là tin xấu.

URL Structure (cấu trúc URL): khách hàng này đang tiêu dùng một cách thông thường đối với những URL, mẫu đã từng tiêu dùng qua phổ biến thời gian và được đánh giá là thấp (có thể đề cập như vậy). đó là, đặt mọi các trang sản phẩm trực tiếp ra khỏi gốc của tên miền (companyname.com/product-name). Tôi luôn luôn tin tưởng vào điều này nhưng trong thực tế thì lại ko buộc phải như vậy. Công cụ chọn kiếm nên linh hoạt hơn chiếc này. cùng sở hữu sự thay đổi trong thuật toán mobile, tôi ủng hộ mạnh mẽ cấu trúc URL theo sau cấu trúc của website (và breadcrumb theo sau chiếc này). Chúng tôi sẽ viết lại tất cả những URL có định dạng yêu thích và thêm vào các trang danh mục, vốn chưa sở hữu gì trước đó.

Chúng tôi đã tạo ra số đông thay đổi (nhưng nhiều thiết bị vẫn chưa ở đúng vị trí mà chúng phải bắt buộc ở). Chúng tôi ko thể lùi lại và bắt đầu xem xét về cách tiếp cận chiến lược, loại đã được lập kế hoạch phương pháp đây tương đối lâu. Chúng tôi chú ý tới các trang bị giống như phân tích thiếu sót về nội dung, đẩy mạnh kiến trúc thông tin, mẫu mã lại website, chiến lược truyền thông xã hội, PR và tối ưu hóa tính chuyển đổi/tính khả dụng. đa số các điều này đều quan trọng và nó đều được bắt đầu từ việc thu thập dữ liệu.

0 nhận xét:

Đăng nhận xét