පයිතන්: ස්ක්‍රිප්ට් ගූගල් ඔබේ ස්වයංක්‍රීය සෙවුම් මූල පද සඳහා ප්‍රවණතා උපුටා ගැනීම

ස්වයංක්‍රීය යෝජනා ප්‍රවණතා ග්‍රහණය කර ගැනීමට පයිතන් ස්ක්‍රිප්ට්

හැමෝම ගූගල් ප්‍රවණතාවලට කැමතියි, නමුත් එය දිගු වලිගය පද සම්බන්ධයෙන් ගත් විට එය ටිකක් උපක්‍රමශීලීයි. අපි හැමෝම කැමතියි නිලධාරියාට ගූගල් ප්‍රවණතා සේවාව සෙවුම් හැසිරීම පිළිබඳ අවබෝධයක් ලබා ගැනීම සඳහා. කෙසේ වෙතත්, කාරණා දෙකක් බොහෝ දෙනා එය solid න වැඩ සඳහා භාවිතා කිරීමෙන් වළක්වයි;

  1. ඔබට සොයා ගැනීමට අවශ්‍ය වූ විට නව නිකේතන මූල පද, එතන ගූගල් ප්‍රවණතා වල ප්‍රමාණවත් දත්ත නොමැත 
  2. ගූගල් ප්‍රවණතා සඳහා ඉල්ලීම් කිරීම සඳහා නිල API නොමැති වීම: අපි වැනි මොඩියුල භාවිතා කරන විට pytrends, එවිට අපට ප්‍රොක්සි සේවාදායක භාවිතා කිරීමට සිදුවේ, නැතහොත් අප අවහිර කරනු ලැබේ. 

මෙම ලිපියෙන්, ගූගල් ස්වයංක්‍රීය යෝජනා හරහා ප්‍රවණතා පද අපනයනය කිරීම සඳහා අප විසින් ලියන ලද පයිතන් පිටපතක් බෙදා ගන්නෙමි.

කාලයත් සමඟ ප්‍රති Results ල ස්වයංක්‍රීයව ලබා ගැනීම සහ ගබඩා කිරීම 

ගූගල් ස්වයංක්‍රීය යෝජනා වෙත යැවීමට අපට බීජ මූල පද 1,000 ක් ඇතැයි සිතමු. ඒ වෙනුවට, අපට බොහෝ විට 200,000 ක් පමණ ලැබෙනු ඇත දිග වලිගය මූල පද. සතියකට පසුව අප එයම කළ යුතු අතර ප්‍රශ්න දෙකකට පිළිතුරු සැපයීම සඳහා මෙම දත්ත කට්ටල සංසන්දනය කරන්න:

  • කුමන විමසුම් නව මූල පද අන්තිම වතාවට සාපේක්ෂව? බොහෝ විට අපට අවශ්‍ය වන්නේ මෙයයි. ගූගල් සිතන්නේ එම විමසුම් වඩාත් වැදගත් වන බවයි - එසේ කිරීමෙන් අපට අපගේම ගූගල් ස්වයංක්‍රීය විසඳුමක් නිර්මාණය කළ හැකිය! 
  • කුමන විමසුම් මූල පද තවදුරටත් නොමැත ප්‍රවණතාවක්?

ස්ක්‍රිප්ට් එක සෑහෙන්න පහසුයි, මම බෙදාගත් බොහෝ කේත මෙහි. යාවත්කාලීන කළ කේතය අතීත ධාවන වලින් දත්ත සුරකින අතර කාලයත් සමඟ යෝජනා සංසන්දනය කරයි. SQLite වැනි ගොනු පාදක දත්ත සමුදායන් සරල කිරීම සඳහා අපි එය වළක්වා ගත්තෙමු - එබැවින් සියලු දත්ත ආචයනය පහත CSV ගොනු භාවිතා කරයි. මෙමඟින් එක්සෙල් හි ගොනුව ආයාත කිරීමට සහ ඔබේ ව්‍යාපාරය සඳහා වැදගත් වචන ප්‍රවණතා ගවේෂණය කිරීමට ඔබට හැකියාව ලැබේ.

මෙම පයිතන් පිටපත භාවිතා කිරීමට

  1. ස්වයං සම්පුර්ණ කිරීම සඳහා යැවිය යුතු ඔබේ බීජ යතුරු පද කට්ටලය ඇතුළත් කරන්න: keywords.csv
  2. ඔබගේ අවශ්‍යතාවය සඳහා ස්ක්‍රිප්ට් සැකසුම් සකස් කරන්න:
    • භාෂාව: පෙරනිමි “එන්”
    • රට: පෙරනිමිය “අප”
  3. ස්ක්‍රිප්ට් සතියකට වරක් ධාවනය කිරීමට උපලේඛනගත කරන්න. ඔබට අවශ්‍ය පරිදි එය අතින් ධාවනය කළ හැකිය.
  4. වැඩිදුර විශ්ලේෂණය සඳහා keyword_suggestions.csv භාවිතා කරන්න:
    • පළමු_සීන්: ස්වයංක්‍රීය විමසුමෙහි පළමු වරට විමසුම දර්ශනය වූ දිනය මෙයයි
    • අන්තිම_සීන්: විමසුම අවසන් වරට දුටු දිනය
    • is_New: first_seen == last_seen නම් අපි මෙය සකසා ඇත සැබෑ - ගූගල් ස්වයංක්‍රීය යෝජනා තුළ නව ප්‍රවණතා සෙවීම් ලබා ගැනීමට මෙම අගය පෙරහන් කරන්න.

මෙන්න පයිතන් කේතය

# Pemavor.com Autocomplete Trends
# Author: Stefan Neefischer (stefan.neefischer@gmail.com)
import concurrent.futures
from datetime import date
from datetime import datetime
import pandas as pd
import itertools
import requests
import string
import json
import time

charList = " " + string.ascii_lowercase + string.digits

def makeGoogleRequest(query):
    # If you make requests too quickly, you may be blocked by google 
    time.sleep(WAIT_TIME)
    URL="http://suggestqueries.google.com/complete/search"
    PARAMS = {"client":"opera",
            "hl":LANGUAGE,
            "q":query,
            "gl":COUNTRY}
    response = requests.get(URL, params=PARAMS)
    if response.status_code == 200:
        try:
            suggestedSearches = json.loads(response.content.decode('utf-8'))[1]
        except:
            suggestedSearches = json.loads(response.content.decode('latin-1'))[1]
        return suggestedSearches
    else:
        return "ERR"

def getGoogleSuggests(keyword):
    # err_count1 = 0
    queryList = [keyword + " " + char for char in charList]
    suggestions = []
    for query in queryList:
        suggestion = makeGoogleRequest(query)
        if suggestion != 'ERR':
            suggestions.append(suggestion)

    # Remove empty suggestions
    suggestions = set(itertools.chain(*suggestions))
    if "" in suggestions:
        suggestions.remove("")
    return suggestions

def autocomplete(csv_fileName):
    dateTimeObj = datetime.now().date()
    #read your csv file that contain keywords that you want to send to google autocomplete
    df = pd.read_csv(csv_fileName)
    keywords = df.iloc[:,0].tolist()
    resultList = []

    with concurrent.futures.ThreadPoolExecutor(max_workers=MAX_WORKERS) as executor:
        futuresGoogle = {executor.submit(getGoogleSuggests, keyword): keyword for keyword in keywords}

        for future in concurrent.futures.as_completed(futuresGoogle):
            key = futuresGoogle[future]
            for suggestion in future.result():
                resultList.append([key, suggestion])

    # Convert the results to a dataframe
    suggestion_new = pd.DataFrame(resultList, columns=['Keyword','Suggestion'])
    del resultList

    #if we have old results read them
    try:
        suggestion_df=pd.read_csv("keyword_suggestions.csv")
        
    except:
        suggestion_df=pd.DataFrame(columns=['first_seen','last_seen','Keyword','Suggestion'])
    
    suggestionCommon_list=[]
    suggestionNew_list=[]
    for keyword in suggestion_new["Keyword"].unique():
        new_df=suggestion_new[suggestion_new["Keyword"]==keyword]
        old_df=suggestion_df[suggestion_df["Keyword"]==keyword]
        newSuggestion=set(new_df["Suggestion"].to_list())
        oldSuggestion=set(old_df["Suggestion"].to_list())
        commonSuggestion=list(newSuggestion & oldSuggestion)
        new_Suggestion=list(newSuggestion - oldSuggestion)
         
        for suggest in commonSuggestion:
            suggestionCommon_list.append([dateTimeObj,keyword,suggest])
        for suggest in new_Suggestion:
            suggestionNew_list.append([dateTimeObj,dateTimeObj,keyword,suggest])
    
    #new keywords
    newSuggestion_df = pd.DataFrame(suggestionNew_list, columns=['first_seen','last_seen','Keyword','Suggestion'])
    #shared keywords with date update
    commonSuggestion_df = pd.DataFrame(suggestionCommon_list, columns=['last_seen','Keyword','Suggestion'])
    merge=pd.merge(suggestion_df, commonSuggestion_df, left_on=["Suggestion"], right_on=["Suggestion"], how='left')
    merge = merge.rename(columns={'last_seen_y': 'last_seen',"Keyword_x":"Keyword"})
    merge["last_seen"].fillna(merge["last_seen_x"], inplace=True)
    del merge["last_seen_x"]
    del merge["Keyword_y"]
    
    #merge old results with new results
    frames = [merge, newSuggestion_df]
    keywords_df =  pd.concat(frames, ignore_index=True, sort=False)
    # Save dataframe as a CSV file
    keywords_df['first_seen'] = pd.to_datetime(keywords_df['first_seen'])
    keywords_df = keywords_df.sort_values(by=['first_seen','Keyword'], ascending=[False,False])   
    keywords_df['first_seen']= pd.to_datetime(keywords_df['first_seen'])
    keywords_df['last_seen']= pd.to_datetime(keywords_df['last_seen'])
    keywords_df['is_new'] = (keywords_df['first_seen']== keywords_df['last_seen'])
    keywords_df=keywords_df[['first_seen','last_seen','Keyword','Suggestion','is_new']]
    keywords_df.to_csv('keyword_suggestions.csv', index=False)

# If you use more than 50 seed keywords you should slow down your requests - otherwise google is blocking the script
# If you have thousands of seed keywords use e.g. WAIT_TIME = 1 and MAX_WORKERS = 5
WAIT_TIME = 0.2
MAX_WORKERS = 20
# set the autocomplete language
LANGUAGE = "en"
# set the autocomplete country code - DE, US, TR, GR, etc..
COUNTRY="US"
# Keyword_seed csv file name. One column csv file.
#csv_fileName="keyword_seeds.csv"
CSV_FILE_NAME="keywords.csv"
autocomplete(CSV_FILE_NAME)
#The result will save in keyword_suggestions.csv csv file

පයිතන් පිටපත බාගන්න

මෙම වෙබ් අඩවිය ස්පෑම් අඩු කිරීම සඳහා Akismet භාවිතා කරයි. ඔබේ ප්රතිචාර දත්ත සැකසූ ආකාරය ඉගෙන ගන්න.