服装网 item_get 接口对接全攻略：从入门到精通

服装网（聚焦服饰、鞋包、配饰等时尚品类的电商平台）的商品详情数据（如尺码表、材质成分、穿搭建议、库存颜色等）对电商选品、比价工具、时尚趋势分析等场景具有重要价值。由于平台无公开官方 API，开发者需通过页面解析实现商品详情（item_get）的获取。本文系统讲解接口对接逻辑、技术实现、反爬应对及时尚品类特有字段解析，帮助开发者构建稳定的服装类商品数据获取系统。

一、接口基础认知（核心功能与场景）

核心功能服装网item_get接口（非官方命名）通过商品 ID（item_id）获取目标商品的全量信息，核心字段聚焦时尚特性：

基础信息：商品 ID、标题（含风格 / 季节，如 “2024 秋季复古连衣裙”）、主图 + 细节图 + 穿搭图、品牌、类目（如 “女装 > 连衣裙”）、详情页 URL价格信息：当前价、原价、优惠活动（如 “满 200 减 50”）、会员价、预售规则（如 “付定金立减”）规格信息：尺码表（肩宽、胸围、衣长等）、颜色选项（含颜色图）、可选尺码（如 “S/M/L” 及对应库存）商品特性：材质成分（如 “95% 棉 + 5% 氨纶”）、工艺细节（如 “刺绣”“水洗做旧”）、风格标签（如 “通勤”“甜辣”）、适用季节库存数据：各颜色 – 尺码组合的实时库存、总库存、预售进度（如 “已售 80%”）用户反馈：用户评价（含晒图）、尺码推荐（如 “偏大一码”）、满意度评分

典型应用场景

电商选品工具：获取 “秋季风衣” 的材质、价格区间及用户评价，筛选高性价比款式尺码推荐系统：基于商品尺码表和用户评价中的 “尺码建议”，为消费者推荐合适尺码时尚趋势分析：跟踪 “牛仔外套” 的风格标签变化（如 “复古风→oversize”），分析流行趋势比价监控：对比同款连衣裙在不同平台的价格、优惠活动及库存状态

接口特性

时尚导向性：数据突出风格、材质、尺码等服饰核心决策因素，包含大量视觉内容（多图展示）非官方性：依赖页面 HTML 解析，无公开 API，动态加载内容多（如颜色切换后的库存、用户晒图）反爬机制：包含 IP 限制（高频请求封锁）、User-Agent 校验、Cookie 验证（部分评价需登录）、请求频率监控规格复杂性：服装商品多含 “颜色 + 尺码” 二维规格，库存需按组合单独获取

二、对接前置准备（环境与 URL 结构）

开发环境

开发语言：Python（推荐，适合处理 HTML 解析与反爬）核心库：
网络请求：requests（同步请求）、aiohttp（异步批量获取）页面解析：BeautifulSoup（静态 HTML 解析）、lxml（XPath 提取复杂结构，如尺码表）反爬工具：fake_useragent（随机 User-Agent）、proxy_pool（代理 IP 池）数据处理：re（正则提取材质、尺码）、json（解析动态库存接口）

商品 ID 与 URL 结构服装网商品详情页 URL 格式通常为：https://www.fuzhuang.com/item/{item_id}.html，其中item_id为商品唯一标识（多为数字或数字 + 字母组合，如123456或CLOTH202409）。示例：某品牌连衣裙详情页 https://www.fuzhuang.com/item/123456.html，商品 ID 为123456。

页面结构分析通过浏览器开发者工具（F12）分析详情页结构，核心数据位置：

静态数据：标题、主图、价格等嵌入主页面 HTML（如<h1 class="goods-title"> <div class="price-current">）；动态数据：颜色 – 尺码库存、用户晒图、详细尺码表等通过 AJAX 接口加载（如https://www.fuzhuang.com/ajax/sku/stock?item_id={item_id}）；规格数据：颜色选项在<div class="color-select">标签，尺码选项在<div class="size-select">标签，需关联库存接口获取可用状态。

三、接口调用流程（基于页面解析）

以 “获取某品牌秋季连衣裙商品详情” 为例，核心流程为URL 构建→主页面解析→动态数据补充→规格与库存关联→数据结构化：

URL 与请求头构建

目标 URL：https://www.fuzhuang.com/item/{item_id}.html（替换item_id为实际值）；请求头：模拟浏览器行为，需包含User-Agent、Referer，部分用户评价需携带登录态Cookie：

python

运行



headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36",
    "Referer": "https://www.fuzhuang.com/category/women/dress/",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
    "Cookie": "session_id=xxx; user_id=xxx"  # 登录后从浏览器获取
}

主页面静态数据解析从主页面 HTML 中提取基础信息，重点关注服饰特有字段：

字段	解析方式（CSS 选择器 / XPath）	示例值
商品标题	`h1.goods-title`（CSS 选择器）	“2024 秋季复古碎花连衣裙收腰显瘦”
图片列表	`div.gallery img`的`src`属性（含主图、细节图）	`["https://img.fuzhuang.com/xxx.jpg", ...]`
当前价	`div.price-current`的文本（去除 “¥”）	“299.00”（元）
原价	`div.price-original`的文本（去除 “¥”）	“499.00”（元）
品牌	`div.brand-name a`的文本	“XX 女装”
材质成分	`div.material`的文本（提取关键信息）	“面料：95% 棉 5% 氨纶”
风格标签	`div.style-tags span`的文本列表	`["复古", "通勤", "碎花"]`
颜色选项	`div.color-select .color-item`的`data-color`属性	`["黑色", "米色", "碎花"]`

动态数据补充（AJAX 接口）尺码表、库存、用户晒图等通过动态接口加载，需单独调用：

库存接口示例：https://www.fuzhuang.com/ajax/sku/stock?item_id={item_id}；响应示例（库存数据）：

json



{
  "data": {
    "skus": [
      {"color": "黑色", "size": "S", "stock": 120, "sku_id": "123456-S-黑"},
      {"color": "黑色", "size": "M", "stock": 85, "sku_id": "123456-M-黑"},
      {"color": "米色", "size": "S", "stock": 0, "sku_id": "123456-S-米"}  // 无库存
    ],
    "total_stock": 205
  }
}

尺码表接口示例：https://www.fuzhuang.com/ajax/size/table?item_id={item_id}，返回详细尺寸数据（肩宽、胸围等）。

规格与库存关联服装商品的 “颜色 + 尺码” 组合是核心规格，需将静态颜色 / 尺码选项与动态库存数据关联：

从静态页面提取所有颜色（如["黑色", "米色"]）和尺码（如["S", "M", "L"]）；从库存接口筛选stock > 0的有效组合，标记可购买状态；示例：黑色 – S（库存 120）、黑色 – M（库存 85）为可购，米色 – S（库存 0）为不可购。

数据整合与结构化合并静态、动态数据，形成标准化字典，突出服饰特性：

python

运行



standardized_data = {
    "item_id": item_id,
    "title": title,
    "images": {
        "main": main_images,  # 主图
        "detail": detail_images,  # 细节图
        "style": style_images  # 穿搭图
    },
    "price": {
        "current": current_price,
        "original": original_price,
        "discount": discount_info,  # 优惠信息
        "member_price": member_price  # 会员价
    },
    "specs": {
        "colors": [
            {
                "name": color_name,
                "image": color_image_url,  # 颜色对应的图片
                "sizes": [
                    {
                        "name": size_name,
                        "stock": stock_num,
                        "sku_id": sku_id  # 唯一规格ID
                    } for size_name, stock_num, sku_id in color_sizes
                ]
            } for color_name, color_image_url, color_sizes in color_list
        ]
    },
    "size_table": size_table,  # 尺码表（肩宽、胸围等）
    "material": material,  # 材质成分
    "style_tags": style_tags,  # 风格标签
    "user_feedback": {
        "rating": rating,  # 综合评分
        "comments": comments,  # 精选评价（含晒图）
        "size_suggestions": size_suggestions  # 尺码建议（如“偏大一码”）
    },
    "url": detail_url
}

四、代码实现示例（Python）

以下是item_get接口的完整实现，包含主页面解析、动态接口调用、规格库存关联及反爬处理：



import requests
import time
import random
import re
import json
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
from typing import Dict, List
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
class FuzhuangItemApi:
    def __init__(self, proxy_pool: List[str] = None, cookie: str = ""):
        self.base_url = "https://www.fuzhuang.com/item/{item_id}.html"
        self.stock_api = "https://www.fuzhuang.com/ajax/sku/stock"  # 库存接口
        self.size_table_api = "https://www.fuzhuang.com/ajax/size/table"  # 尺码表接口
        self.ua = UserAgent()
        self.proxy_pool = proxy_pool  # 代理池列表
        self.cookie = cookie  # 登录态Cookie（用于评价等需登录的内容）
 
    def _get_headers(self) -> Dict[str, str]:
        """生成随机请求头"""
        headers = {
            "User-Agent": self.ua.random,
            "Referer": "https://www.fuzhuang.com/category/",
            "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"
        }
        if self.cookie:
            headers["Cookie"] = self.cookie
        return headers
 
    def _get_proxy(self) -> Dict[str, str]:
        """随机获取代理"""
        if self.proxy_pool and len(self.proxy_pool) > 0:
            proxy = random.choice(self.proxy_pool)
            return {"http": proxy, "https": proxy}
        return None
 
    def _clean_price(self, price_str: str) -> float:
        """清洗价格字符串（去除¥、逗号等）"""
        if not price_str:
            return 0.0
        price_str = re.sub(r"[^d.]", "", price_str)
        return float(price_str) if price_str else 0.0
 
    def _parse_size_table(self, size_data: Dict) -> List[Dict]:
        """解析尺码表数据（如肩宽、胸围）"""
        if not size_data.get("data"):
            return []
        table = size_data["data"].get("table", [])
        # 转换为[{ "尺码": "S", "肩宽": "36cm", ... }, ...]
        return [dict(zip(table[0], row)) for row in table[1:]] if table else []
 
    def _parse_static_data(self, html: str) -> Dict:
        """解析主页面静态数据"""
        soup = BeautifulSoup(html, "lxml")
        
        # 提取颜色选项（含颜色图）
        color_list = []
        for color_item in soup.select("div.color-select .color-item"):
            color_name = color_item.get("data-color") or ""
            color_img = color_item.select_one("img")?.get("src") or ""
            color_list.append({"name": color_name, "image": color_img})
        
        # 提取尺码选项（名称）
        size_names = [size.get("data-size") for size in soup.select("div.size-select .size-item") if size.get("data-size")]
        
        # 提取材质成分（清洗文本）
        material = soup.select_one("div.material")?.text.strip() or ""
        material = re.sub(r"s+", " ", material)  # 去除多余空格
        
        return {
            "title": soup.select_one("h1.goods-title")?.text.strip() or "",
            "images": {
                "main": [img.get("src") for img in soup.select("div.main-gallery img") if img.get("src")],
                "detail": [img.get("src") for img in soup.select("div.detail-images img") if img.get("src")],
                "style": [img.get("src") for img in soup.select("div.style-show img") if img.get("src")]
            },
            "price": {
                "current": self._clean_price(soup.select_one("div.price-current")?.text or ""),
                "original": self._clean_price(soup.select_one("div.price-original")?.text or ""),
                "discount": soup.select_one("div.discount-tag")?.text.strip() or "",
                "member_price": self._clean_price(soup.select_one("div.member-price")?.text or "")
            },
            "brand": soup.select_one("div.brand-name a")?.text.strip() or "",
            "material": material,
            "style_tags": [tag.text.strip() for tag in soup.select("div.style-tags span")],
            "specs": {
                "colors": color_list,
                "size_names": size_names
            },
            "user_feedback": {
                "rating": float(soup.select_one("div.average-rating")?.text or "0"),
                "comment_count": int(re.search(r"d+", soup.select_one("div.comment-count")?.text or "0").group()) if soup.select_one("div.comment-count") else 0
            }
        }
 
    def _parse_comments(self, html: str) -> List[Dict]:
        """解析用户评价（含尺码建议）"""
        soup = BeautifulSoup(html, "lxml")
        comments = []
        for item in soup.select("div.comment-item")[:5]:  # 取前5条
            user_info = item.select_one("div.user-info")?.text.strip() or "匿名用户"
            # 提取用户体型（如“165cm/50kg”）
            body_type = re.search(r"d+cm/d+kg", user_info).group() if re.search(r"d+cm/d+kg", user_info) else ""
            # 提取购买的规格（颜色+尺码）
            buy_spec = item.select_one("div.buy-spec")?.text.strip() or ""
            # 提取评价内容
            content = item.select_one("div.comment-content")?.text.strip() or ""
            # 提取尺码建议（如“偏大一码”）
            size_suggest = ""
            if "码" in content:
                suggest_match = re.search(r"(偏大|偏小|正常).*?码", content)
                size_suggest = suggest_match.group() if suggest_match else ""
            # 提取晒图
            images = [img.get("src") for img in item.select("div.comment-images img") if img.get("src")]
            
            comments.append({
                "user": user_info,
                "body_type": body_type,
                "buy_spec": buy_spec,
                "content": content,
                "size_suggest": size_suggest,
                "images": images
            })
        return comments
 
    def _fetch_dynamic_data(self, item_id: str, headers: Dict[str, str], proxy: Dict[str, str]) -> Dict:
        """调用动态接口获取库存和尺码表"""
        dynamic_data = {
            "stock": {"skus": [], "total_stock": 0},
            "size_table": []
        }
        try:
            # 1. 获取库存数据
            stock_params = {"item_id": item_id}
            stock_resp = requests.get(
                self.stock_api,
                params=stock_params,
                headers=headers,
                proxies=proxy,
                timeout=10
            )
            stock_data = stock_resp.json()
            if stock_data.get("code") == 0 and "data" in stock_data:
                dynamic_data["stock"] = stock_data["data"]
            
            # 2. 获取尺码表
            size_params = {"item_id": item_id}
            size_resp = requests.get(
                self.size_table_api,
                params=size_params,
                headers=headers,
                proxies=proxy,
                timeout=10
            )
            size_data = size_resp.json()
            dynamic_data["size_table"] = self._parse_size_table(size_data)
            
        except Exception as e:
            print(f"动态数据获取失败: {str(e)}")
        return dynamic_data
 
    def _merge_specs_and_stock(self, static_specs: Dict, stock_data: Dict) -> List[Dict]:
        """合并颜色、尺码与库存数据"""
        colors = static_specs["colors"]
        size_names = static_specs["size_names"]
        skus = stock_data.get("skus", [])
        
        # 按颜色分组库存
        color_stock_map = {}
        for sku in skus:
            color = sku["color"]
            if color not in color_stock_map:
                color_stock_map[color] = []
            color_stock_map[color].append(sku)
        
        # 合并颜色与对应尺码库存
        merged_colors = []
        for color in colors:
            color_name = color["name"]
            color_image = color["image"]
            # 获取该颜色的所有尺码库存
            color_skus = color_stock_map.get(color_name, [])
            # 关联尺码名称（确保顺序与页面一致）
            sizes = []
            for size_name in size_names:
                # 查找该颜色+尺码的库存
                sku_match = next((s for s in color_skus if s["size"] == size_name), None)
                if sku_match:
                    sizes.append({
                        "name": size_name,
                        "stock": sku_match["stock"],
                        "sku_id": sku_match["sku_id"],
                        "available": sku_match["stock"] > 0
                    })
                else:
                    sizes.append({
                        "name": size_name,
                        "stock": 0,
                        "sku_id": "",
                        "available": False
                    })
            merged_colors.append({
                "name": color_name,
                "image": color_image,
                "sizes": sizes
            })
        return merged_colors
 
    def item_get(self, item_id: str, timeout: int = 10) -> Dict:
        """
        获取服装网商品详情
        :param item_id: 商品ID（如123456、CLOTH202409）
        :param timeout: 超时时间
        :return: 标准化商品数据
        """
        try:
            # 1. 主页面请求
            url = self.base_url.format(item_id=item_id)
            headers = self._get_headers()
            proxy = self._get_proxy()
 
            # 随机延迟，避免反爬
            time.sleep(random.uniform(1.5, 3))
            response = requests.get(
                url=url,
                headers=headers,
                proxies=proxy,
                timeout=timeout
            )
            response.raise_for_status()
            main_html = response.text
 
            # 2. 解析主页面数据
            static_data = self._parse_static_data(main_html)
            if not static_data["title"]:
                return {"success": False, "error_msg": "商品不存在或已下架"}
 
            # 3. 解析用户评价
            comments = self._parse_comments(main_html)
            static_data["user_feedback"]["comments"] = comments
            # 提取尺码建议汇总
            size_suggestions = [c["size_suggest"] for c in comments if c["size_suggest"]]
            static_data["user_feedback"]["size_suggestions"] = size_suggestions
 
            # 4. 获取动态数据（库存、尺码表）
            dynamic_data = self._fetch_dynamic_data(item_id, headers, proxy)
 
            # 5. 合并规格与库存
            merged_colors = self._merge_specs_and_stock(
                static_data["specs"],
                dynamic_data["stock"]
            )
 
            # 6. 整合结果
            result = {
                "success": True,
                "data": {
                    "item_id": item_id,** static_data,
                    "specs": {
                        "colors": merged_colors,
                        "total_stock": dynamic_data["stock"].get("total_stock", 0)
                    },
                    "size_table": dynamic_data["size_table"],
                    "url": url,
                    "update_time": time.strftime("%Y-%m-%d %H:%M:%S")
                }
            }
            return result
 
        except requests.exceptions.HTTPError as e:
            if "403" in str(e):
                return {"success": False, "error_msg": "触发反爬，建议更换代理或Cookie", "code": 403}
            return {"success": False, "error_msg": f"HTTP错误: {str(e)}", "code": response.status_code}
        except Exception as e:
            return {"success": False, "error_msg": f"获取失败: {str(e)}", "code": -1}
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
# 使用示例
if __name__ == "__main__":
    # 代理池（替换为有效代理）
    PROXIES = [
        "http://123.45.67.89:8888",
        "http://98.76.54.32:8080"
    ]
    # 登录态Cookie（从浏览器获取，用于评价等内容）
    COOKIE = "session_id=xxx; user_id=xxx"
 
    # 初始化API客户端
    api = FuzhuangItemApi(proxy_pool=PROXIES, cookie=COOKIE)
 
    # 获取商品详情（示例item_id）
    item_id = "123456"  # 替换为实际商品ID
    result = api.item_get(item_id)
 
    if result["success"]:
        data = result["data"]
        print(f"商品标题: {data['title']}")
        print(f"价格: 当前￥{data['price']['current']} | 原价￥{data['price']['original']} | 优惠: {data['price']['discount']}")
        print(f"品牌: {data['brand']} | 材质: {data['material']} | 风格: {', '.join(data['style_tags'])}")
        print(f"用户评分: {data['user_feedback']['rating']}分 | 评价数: {data['user_feedback']['comment_count']}条")
        print(f"颜色选项: {', '.join([c['name'] for c in data['specs']['colors']])}")
        print(f"可购规格示例（{data['specs']['colors'][0]['name']}）:")
        for size in data['specs']['colors'][0]['sizes'][:3]:
            status = "有货" if size['available'] else "无货"
            print(f"  尺码{size['name']}: {size['stock']}件（{status}）")
        print(f"核心尺码表:")
        if data['size_table']:
            for row in data['size_table'][:3]:  # 打印前3行
                print(f"  {row['尺码']}: 肩宽{row.get('肩宽', '')} | 胸围{row.get('胸围', '')} | 衣长{row.get('衣长', '')}")
        print(f"用户尺码建议: {', '.join(data['user_feedback']['size_suggestions'][:3])}")
    else:
        print(f"获取失败: {result['error_msg']}（错误码: {result.get('code')}）")

五、关键技术难点与解决方案

尺码表解析与标准化

问题：服装尺码表格式多样（表格 / 文本），参数命名不统一（如 “衣长” vs “长度”），且包含单位（cm/inch），提取和比对难度大。解决方案：
优先调用动态尺码表接口（结构化数据），若接口不可用则解析页面表格，用pandas转换为标准字典；建立核心参数映射表（如 “衣长”“长度” 统一为 “衣长”），去除单位仅保留数值（便于后续对比）；示例代码中_parse_size_table函数将表格数据转换为标准化列表，支持直接提取 “肩宽”“胸围” 等关键参数。

颜色 – 尺码库存关联

问题：服装商品的库存以 “颜色 + 尺码” 组合为单位（如黑色 – S、米色 – M），需将静态颜色 / 尺码选项与动态库存数据精准关联，避免匹配错误。解决方案：
从静态页面提取颜色名称和尺码名称，作为基础维度；从库存接口获取sku列表，按颜色分组构建映射表（color_stock_map）；遍历静态颜色列表，为每个颜色匹配对应的尺码库存，标记 “有货 / 无货” 状态（available字段）；示例代码中_merge_specs_and_stock函数实现完整关联逻辑，确保库存数据与页面选项一一对应。

用户评价中的尺码建议提取

问题：用户评价中的 “尺码建议”（如 “偏大一码”“165cm 选 M 码”）是服装决策的关键数据，但分散在文本中，需精准提取。解决方案：
用正则匹配关键词（如 “偏大”“偏小”“码”），提取结构化建议（如size_suggest字段）；关联用户体型信息（如 “165cm/50kg”），为尺码推荐系统提供参考；对评价内容进行情感分析（正面 / 负面），结合尺码建议形成综合决策数据。

反爬机制对抗

问题：服装网对商品数据爬取限制严格，高频请求会触发 IP 封锁（403 错误），尤其针对多图商品（图片 URL 易被识别）。解决方案：
代理 IP 轮换：使用高匿代理池，每 2-3 次请求切换 IP，优先选择国内 IP（服装网用户以国内为主）；请求频率控制：单 IP 每分钟请求≤3 次，两次请求间隔 2-4 秒（模拟用户浏览服装详情的节奏）；图片 URL 处理：爬取图片时添加随机延迟（1-2 秒），避免因批量下载图片触发反爬；Cookie 池策略：维护多个登录态 Cookie，随机携带以降低单一账号风险，尤其在获取用户评价时。

六、最佳实践与合规要点

系统架构设计采用 “轻量采集 + 图片缓存” 架构，适配服装类商品特性：

采集层：集成代理池、Cookie 池，控制图片下载频率，避免触发反爬；解析层：分离基础信息与动态数据解析逻辑，重点处理尺码表与库存关联；存储层：用 Redis 缓存商品基础信息（1 小时过期，价格波动较快），对象存储（如 OSS）缓存图片（长期有效）；监控层：实时监控请求成功率、库存数据完整度，异常时通过邮件告警。

性能优化策略

异步批量获取：使用aiohttp并发处理多个item_id（控制并发数≤3），提升效率；按需解析：列表页优先提取item_id、价格、主图等核心字段，详细尺码表和评价通过后续item_get接口补充；图片懒加载：非必要图片（如细节图）可延迟下载，优先保证文字数据获取速度。

合规性与风险控制

频率限制：单 IP 日请求量≤500 次，避免对服务器造成压力，符合平台 robots 协议；数据使用边界：不得将用户评价、晒图用于商业售卖或恶意竞争，需注明数据来源 “服装网”；图片版权：服装图片可能涉及品牌版权，使用时需遵守《著作权法》，不得擅自用于商业宣传。