亚马逊关键词搜索API接口全面解析与实战指南

最新推荐文章于 2026-06-27 20:17:06 发布

原创最新推荐文章于 2026-06-27 20:17:06 发布 · 715 阅读

21 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#python #数据库 #开发语言

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

一、接口概述与适用场景

亚马逊关键词搜索API是电商数据获取的核心工具，主要面向以下两类开发者：

卖家与运营人员：选品分析、竞品监控、价格跟踪
开发者与数据服务商：构建比价工具、商品推荐系统、市场分析平台

亚马逊提供两种官方API体系：

API类型	适用对象	核心功能	数据深度
Product Advertising API (PA-API)	联盟营销伙伴	商品搜索、推广链接生成	基础商品信息+推广数据
Selling Partner API (SP-API)	注册卖家/开发者	商品目录查询、订单管理、库存同步	完整商品数据+销售数据

此外，第三方服务商（如Pangolin、OneBound）也提供封装好的数据采集API，适合快速接入场景。

二、官方API：Product Advertising API 5.0 (PA-API)

2.1 接口能力速览

PA-API是亚马逊官方提供的联盟营销接口，支持通过关键词搜索全球20+站点的商品列表。一次调用可获取：

商品基础信息：ASIN、标题、品牌、主图URL、详情页链接
价格与优惠：售价、原价、折扣率、Prime标识
交易数据：销量排名（Sales Rank）、评分、评论数
库存状态：可售库存、配送时效

2.2 接入前准备

步骤1：注册亚马逊联盟账号

审核通过后获得 Associate Tag（推广ID）

步骤2：申请API密钥

创建应用获取 Access Key 和 Secret Key

步骤3：安装官方SDK

pip install amazon-paapi5

2.3 核心接口：`SearchItems`

请求参数详解：

参数名	类型	必填	说明
`Keywords`	String	是	搜索关键词，支持空格分隔多词
`SearchIndex`	String	否	限定类目（如Electronics）
`ItemPage`	Integer	否	分页页码（1-10）
`SortBy`	String	否	排序方式：`Relevance`/`PriceLowToHigh`/`PriceHighToLow`/`SalesRank`
`ItemCount`	Integer	否	返回数量（默认10，最大20）
`Resources`	Array	是	指定返回字段集合

Python实战代码：

from paapi5_python_sdk.api.default_api import DefaultApi
from paapi5_python_sdk.models.search_request import SearchRequest
from paapi5_python_sdk.models.partner_type import PartnerType
import os

class AmazonKeywordSearcher:
    def __init__(self):
        self.access_key = os.getenv('AMAZON_ACCESS_KEY')
        self.secret_key = os.getenv('AMAZON_SECRET_KEY')
        self.partner_tag = os.getenv('AMAZON_PARTNER_TAG')
        self.host = "webservices.amazon.com"
        self.region = "us-east-1"
        
    def search_by_keyword(self, keyword, search_index="All", item_count=10):
        """
        关键词搜索商品
        """
        request = SearchRequest(
            partner_tag=self.partner_tag,
            partner_type=PartnerType.ASSOCIATES,
            keywords=keyword,
            search_index=search_index,
            item_count=item_count,
            sort_by="SalesRank",  # 按销量排序
            resources=[
                "Images.Primary.Medium",
                "Images.Variants.Small",
                "ItemInfo.Title",
                "ItemInfo.Features",
                "ItemInfo.ProductInfo",
                "Offers.Listings.Price",
                "Offers.Listings.SavingBasis",
                "CustomerReviews.StarRating",
                "BrowseNodeInfo.BrowseNodes"
            ]
        )
        
        api = DefaultApi(
            access_key=self.access_key,
            secret_key=self.secret_key,
            host=self.host,
            region=self.region
        )
        
        try:
            response = api.search_items(request)
            return self._parse_response(response)
        except Exception as e:
            print(f"搜索失败: {str(e)}")
            return None
    
    def _parse_response(self, response):
        """解析响应数据"""
        results = []
        if response.search_result and response.search_result.items:
            for item in response.search_result.items:
                product = {
                    'asin': item.asin,
                    'title': item.item_info.title.display_value if item.item_info else None,
                    'price': item.offers.listings[0].price.display_amount if item.offers else None,
                    'image': item.images.primary.medium.url if item.images else None,
                    'detail_url': item.detail_page_url,
                    'sales_rank': item.browse_node_info.browse_nodes[0].sales_rank if item.browse_node_info else None
                }
                results.append(product)
        return results

# 使用示例
if __name__ == "__main__":
    searcher = AmazonKeywordSearcher()
    products = searcher.search_by_keyword("wireless headphones", "Electronics", 10)
    
    for p in products:
        print(f"ASIN: {p['asin']}, 标题: {p['title']}, 价格: {p['price']}")

响应数据结构：

{
    "search_result": {
        "items": [
            {
                "asin": "B08N5WRWNW",
                "item_info": {
                    "title": {"display_value": "Echo Dot (4th Gen)"},
                    "features": {"display_values": ["Smart speaker with Alexa", "Charcoal"]}
                },
                "offers": {
                    "listings": [{
                        "price": {"display_amount": "$29.99", "currency": "USD"},
                        "saving_basis": {"display_amount": "$49.99"}
                    }]
                },
                "customer_reviews": {
                    "star_rating": {"value": 4.7, "count": 456789}
                },
                "images": {
                    "primary": {"medium": {"url": "https://m.media-amazon.com/..."}}
                }
            }
        ],
        "total_result_count": 5000
    }
}

三、官方API：Selling Partner API (SP-API)

3.1 接口定位

SP-API是亚马逊面向注册卖家的企业级API，提供更深度的商品数据和市场洞察。关键词搜索功能隶属于 catalog-items 模块。

3.2 核心接口：`searchCatalogItems`

关键特性：

集成COSMO算法，返回意图标签（Intent Tags）和相关关键词
支持按价格区间、评分等高级筛选
单次请求最多返回50条数据

请求参数：

参数名	类型	说明
`keywords`	String	搜索关键词，最多20个字符
`marketplaceIds`	String	站点ID（如ATVPDKIKX0DER代表美国站）
`includedData`	Array	包含数据类型：`summaries`/`images`/`salesRanks`
`pageSize`	Integer	分页大小（1-20）

Python调用示例：

import requests
import boto3
from botocore.auth import SigV4Auth
from botocore.awsrequest import AWSRequest

class SPAPIKeywordSearcher:
    def __init__(self, refresh_token, client_id, client_secret):
        self.refresh_token = refresh_token
        self.client_id = client_id
        self.client_secret = client_secret
        self.access_token = self._get_access_token()
        
    def _get_access_token(self):
        """获取访问令牌"""
        url = "https://api.amazon.com/auth/o2/token"
        data = {
            "grant_type": "refresh_token",
            "refresh_token": self.refresh_token,
            "client_id": self.client_id,
            "client_secret": self.client_secret
        }
        response = requests.post(url, data=data)
        return response.json().get("access_token")
    
    def search_catalog_items(self, keywords, marketplace_id="ATVPDKIKX0DER"):
        """
        搜索商品目录
        """
        url = f"https://sellingpartnerapi-na.amazon.com/catalog/2020-12-01/items"
        
        headers = {
            "x-amz-access-token": self.access_token,
            "Content-Type": "application/json"
        }
        
        params = {
            "keywords": keywords,
            "marketplaceIds": marketplace_id,
            "includedData": ["summaries", "images", "salesRanks"],
            "pageSize": 20
        }
        
        response = requests.get(url, headers=headers, params=params)
        
        if response.status_code == 200:
            return self._parse_sp_api_response(response.json())
        else:
            print(f"请求失败: {response.status_code}, {response.text}")
            return None
    
    def _parse_sp_api_response(self, data):
        """解析SP-API响应（含COSMO意图标签）"""
        results = []
        for item in data.get("items", []):
            product = {
                "asin": item.get("asin"),
                "title": item.get("summaries", [{}])[0].get("itemName"),
                "brand": item.get("summaries", [{}])[0].get("brand"),
                "price": item.get("summaries", [{}])[0].get("price", {}).get("amount"),
                "sales_rank": item.get("salesRanks", [{}])[0].get("displayGroupRanks", [{}])[0].get("rank"),
                # COSMO算法生成的意图标签（如存在）
                "intent_tags": item.get("classifications", [{}])[0].get("intentTags", []),
                "related_keywords": item.get("classifications", [{}])[0].get("relatedKeywords", [])
            }
            results.append(product)
        return results

SP-API响应特色字段：

{
    "items": [{
        "asin": "B015DWSQ3W",
        "summaries": [{"itemName": "ECCO Terracruise Lt Waterproof Hiking Boot"}],
        "salesRanks": [{
            "displayGroupRanks": [{"rank": 128}]
        }],
        "classifications": [{
            "intentTags": ["outdoor", "hiking", "rainy_day"],
            "relatedKeywords": ["mens waterproof hiking boots", "lightweight hiking boots"],
            "matchScore": 0.89
        }]
    }]
}

四、第三方数据采集API

对于快速接入或需要突破官方限制的场景，第三方API是常见选择。

4.1 Pangolin Scrape API

特点：无需亚马逊开发者账号，支持批量采集

返回字段：

表格

复制

字段名	说明
`asin`	商品唯一标识
`isSponsored`	是否为广告商品
`isAmazonChoice`	是否为Amazon's Choice
`position`	搜索结果排名
`sales`	销量描述（如"10K+ bought in past month"）

4.2 OneBound API

特点：类似淘宝客API的封装风格，支持多站点

请求URL：https://api-gw.onebound.cn/amazon/item_search/

参数说明：

参数	说明
`q`	搜索关键词
`start_price` / `end_price`	价格区间
`sort`	排序方式
`page`	页码

五、签名算法详解（PA-API）

官方API使用AWS Signature Version 4签名机制：

import hashlib
import hmac
import datetime
import urllib.parse

def generate_pa_api_signature(access_key, secret_key, payload, host, region, service="ProductAdvertisingAPI"):
    """
    生成AWS Signature V4
    """
    # 1. 创建规范请求
    t = datetime.datetime.utcnow()
    amz_date = t.strftime('%Y%m%dT%H%M%SZ')
    date_stamp = t.strftime('%Y%m%d')
    
    # 2. 创建待签名字符串
    credential_scope = f"{date_stamp}/{region}/{service}/aws4_request"
    string_to_sign = f"AWS4-HMAC-SHA256\n{amz_date}\n{credential_scope}\n" + \
                     hashlib.sha256(payload.encode('utf-8')).hexdigest()
    
    # 3. 计算签名密钥
    def get_signature_key(key, date_stamp, region_name, service_name):
        k_date = hmac.new(('AWS4' + key).encode('utf-8'), date_stamp.encode('utf-8'), hashlib.sha256).digest()
        k_region = hmac.new(k_date, region_name.encode('utf-8'), hashlib.sha256).digest()
        k_service = hmac.new(k_region, service_name.encode('utf-8'), hashlib.sha256).digest()
        k_signing = hmac.new(k_service, 'aws4_request'.encode('utf-8'), hashlib.sha256).digest()
        return k_signing
    
    signing_key = get_signature_key(secret_key, date_stamp, region, service)
    signature = hmac.new(signing_key, string_to_sign.encode('utf-8'), hashlib.sha256).hexdigest()
    
    # 4. 构建Authorization头
    auth_header = f"AWS4-HMAC-SHA256 Credential={access_key}/{credential_scope}, " \
                  f"SignedHeaders=host;x-amz-date, Signature={signature}"
    
    return auth_header, amz_date

六、最佳实践与合规建议

6.1 频率限制与错误处理

API类型	限制	建议策略
PA-API	免费层1000请求/天	实现缓存，热门关键词结果缓存24小时
SP-API	动态限流（通常1-2秒/请求）	指数退避重试：等待时间 = 基础间隔 × 2^尝试次数
第三方API	按套餐计费	批量请求降低单次成本

重试逻辑实现：

import time
import random

def retry_with_backoff(func, max_retries=3, base_delay=1):
    """指数退避重试"""
    for attempt in range(max_retries):
        try:
            return func()
        except Exception as e:
            if attempt == max_retries - 1:
                raise
            delay = base_delay * (2 ** attempt) + random.uniform(0, 1)
            print(f"请求失败，{delay:.2f}秒后重试...")
            time.sleep(delay)

6.2 数据合规要点

数据来源标注：2025年起需在结果中明确标注数据来源为Amazon
隐私保护：不得存储用户个人身份信息（PII）
使用场景限制：禁止用于转售数据、自动化下单等违规场景

6.3 关键词优化技巧

def optimize_search_params(base_keyword):
    """
    搜索参数优化建议
    """
    return {
        "primary": base_keyword,
        "variations": [
            f"{base_keyword} for women",  # 人群细分
            f"{base_keyword} prime",       # Prime筛选
            f"{base_keyword} best seller"  # 畅销筛选
        ],
        "filters": {
            "min_rating": 4.0,      # 评分过滤
            "max_price": 100.00,    # 价格上限
            "availability": "Available"  # 有货筛选
        }
    }

七、总结对比

维度	PA-API	SP-API	第三方API
接入门槛	需Amazon Associate账号	需注册卖家身份	低，注册即用
数据深度	基础商品+推广数据	完整销售数据+意图标签	视服务商而定
成本	免费（有限额）	免费（需店铺资质）	按量计费
合规性	高	最高	中
适用场景	联盟营销、比价网站	卖家运营、ERP系统	快速原型、大数据分析