服装网(聚焦服饰、鞋包、配饰等时尚品类的电商平台)的商品详情数据(如尺码表、材质成分、穿搭建议、库存颜色等)对电商选品、比价工具、时尚趋势分析等场景具有重要价值。由于平台无公开官方 API,开发者需通过页面解析实现商品详情()的获取。本文系统讲解接口对接逻辑、技术实现、反爬应对及时尚品类特有字段解析,帮助开发者构建稳定的服装类商品数据获取系统。
item_get
一、接口基础认知(核心功能与场景)
核心功能服装网接口(非官方命名)通过商品 ID(
item_get)获取目标商品的全量信息,核心字段聚焦时尚特性:
item_id
基础信息:商品 ID、标题(含风格 / 季节,如 “2024 秋季复古连衣裙”)、主图 + 细节图 + 穿搭图、品牌、类目(如 “女装 > 连衣裙”)、详情页 URL价格信息:当前价、原价、优惠活动(如 “满 200 减 50”)、会员价、预售规则(如 “付定金立减”)规格信息:尺码表(肩宽、胸围、衣长等)、颜色选项(含颜色图)、可选尺码(如 “S/M/L” 及对应库存)商品特性:材质成分(如 “95% 棉 + 5% 氨纶”)、工艺细节(如 “刺绣”“水洗做旧”)、风格标签(如 “通勤”“甜辣”)、适用季节库存数据:各颜色 – 尺码组合的实时库存、总库存、预售进度(如 “已售 80%”)用户反馈:用户评价(含晒图)、尺码推荐(如 “偏大一码”)、满意度评分
典型应用场景
电商选品工具:获取 “秋季风衣” 的材质、价格区间及用户评价,筛选高性价比款式尺码推荐系统:基于商品尺码表和用户评价中的 “尺码建议”,为消费者推荐合适尺码时尚趋势分析:跟踪 “牛仔外套” 的风格标签变化(如 “复古风→oversize”),分析流行趋势比价监控:对比同款连衣裙在不同平台的价格、优惠活动及库存状态
接口特性
时尚导向性:数据突出风格、材质、尺码等服饰核心决策因素,包含大量视觉内容(多图展示)非官方性:依赖页面 HTML 解析,无公开 API,动态加载内容多(如颜色切换后的库存、用户晒图)反爬机制:包含 IP 限制(高频请求封锁)、User-Agent 校验、Cookie 验证(部分评价需登录)、请求频率监控规格复杂性:服装商品多含 “颜色 + 尺码” 二维规格,库存需按组合单独获取
二、对接前置准备(环境与 URL 结构)
开发环境
开发语言:Python(推荐,适合处理 HTML 解析与反爬)核心库:
网络请求:(同步请求)、
requests(异步批量获取)页面解析:
aiohttp(静态 HTML 解析)、
BeautifulSoup(XPath 提取复杂结构,如尺码表)反爬工具:
lxml(随机 User-Agent)、
fake_useragent(代理 IP 池)数据处理:
proxy_pool(正则提取材质、尺码)、
re(解析动态库存接口)
json
商品 ID 与 URL 结构服装网商品详情页 URL 格式通常为:,其中
https://www.fuzhuang.com/item/{item_id}.html为商品唯一标识(多为数字或数字 + 字母组合,如
item_id或
123456)。示例:某品牌连衣裙详情页
CLOTH202409,商品 ID 为
https://www.fuzhuang.com/item/123456.html。
123456
页面结构分析通过浏览器开发者工具(F12)分析详情页结构,核心数据位置:
静态数据:标题、主图、价格等嵌入主页面 HTML(如
<h1 class="goods-title">);动态数据:颜色 – 尺码库存、用户晒图、详细尺码表等通过 AJAX 接口加载(如
<div class="price-current">);规格数据:颜色选项在
https://www.fuzhuang.com/ajax/sku/stock?item_id={item_id}标签,尺码选项在
<div class="color-select">标签,需关联库存接口获取可用状态。
<div class="size-select">
三、接口调用流程(基于页面解析)
以 “获取某品牌秋季连衣裙商品详情” 为例,核心流程为URL 构建→主页面解析→动态数据补充→规格与库存关联→数据结构化:
URL 与请求头构建
目标 URL:(替换
https://www.fuzhuang.com/item/{item_id}.html为实际值);请求头:模拟浏览器行为,需包含
item_id、
User-Agent,部分用户评价需携带登录态
Referer:
Cookie
python
运行
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36",
"Referer": "https://www.fuzhuang.com/category/women/dress/",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Cookie": "session_id=xxx; user_id=xxx" # 登录后从浏览器获取
}
主页面静态数据解析从主页面 HTML 中提取基础信息,重点关注服饰特有字段:
| 字段 | 解析方式(CSS 选择器 / XPath) | 示例值 |
|---|---|---|
| 商品标题 | (CSS 选择器) |
“2024 秋季复古碎花连衣裙 收腰显瘦” |
| 图片列表 | 的属性(含主图、细节图) |
|
| 当前价 | 的文本(去除 “¥”) |
“299.00”(元) |
| 原价 | 的文本(去除 “¥”) |
“499.00”(元) |
| 品牌 | 的文本 |
“XX 女装” |
| 材质成分 | 的文本(提取关键信息) |
“面料:95% 棉 5% 氨纶” |
| 风格标签 | 的文本列表 |
|
| 颜色选项 | 的属性 |
|
动态数据补充(AJAX 接口)尺码表、库存、用户晒图等通过动态接口加载,需单独调用:
库存接口示例:;响应示例(库存数据):
https://www.fuzhuang.com/ajax/sku/stock?item_id={item_id}
json
{
"data": {
"skus": [
{"color": "黑色", "size": "S", "stock": 120, "sku_id": "123456-S-黑"},
{"color": "黑色", "size": "M", "stock": 85, "sku_id": "123456-M-黑"},
{"color": "米色", "size": "S", "stock": 0, "sku_id": "123456-S-米"} // 无库存
],
"total_stock": 205
}
}
尺码表接口示例:,返回详细尺寸数据(肩宽、胸围等)。
https://www.fuzhuang.com/ajax/size/table?item_id={item_id}
规格与库存关联服装商品的 “颜色 + 尺码” 组合是核心规格,需将静态颜色 / 尺码选项与动态库存数据关联:
从静态页面提取所有颜色(如)和尺码(如
["黑色", "米色"]);从库存接口筛选
["S", "M", "L"]的有效组合,标记可购买状态;示例:黑色 – S(库存 120)、黑色 – M(库存 85)为可购,米色 – S(库存 0)为不可购。
stock > 0
数据整合与结构化合并静态、动态数据,形成标准化字典,突出服饰特性:
python
运行
standardized_data = {
"item_id": item_id,
"title": title,
"images": {
"main": main_images, # 主图
"detail": detail_images, # 细节图
"style": style_images # 穿搭图
},
"price": {
"current": current_price,
"original": original_price,
"discount": discount_info, # 优惠信息
"member_price": member_price # 会员价
},
"specs": {
"colors": [
{
"name": color_name,
"image": color_image_url, # 颜色对应的图片
"sizes": [
{
"name": size_name,
"stock": stock_num,
"sku_id": sku_id # 唯一规格ID
} for size_name, stock_num, sku_id in color_sizes
]
} for color_name, color_image_url, color_sizes in color_list
]
},
"size_table": size_table, # 尺码表(肩宽、胸围等)
"material": material, # 材质成分
"style_tags": style_tags, # 风格标签
"user_feedback": {
"rating": rating, # 综合评分
"comments": comments, # 精选评价(含晒图)
"size_suggestions": size_suggestions # 尺码建议(如“偏大一码”)
},
"url": detail_url
}
四、代码实现示例(Python)
以下是接口的完整实现,包含主页面解析、动态接口调用、规格库存关联及反爬处理:
item_get
import requests
import time
import random
import re
import json
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
from typing import Dict, List
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
class FuzhuangItemApi:
def __init__(self, proxy_pool: List[str] = None, cookie: str = ""):
self.base_url = "https://www.fuzhuang.com/item/{item_id}.html"
self.stock_api = "https://www.fuzhuang.com/ajax/sku/stock" # 库存接口
self.size_table_api = "https://www.fuzhuang.com/ajax/size/table" # 尺码表接口
self.ua = UserAgent()
self.proxy_pool = proxy_pool # 代理池列表
self.cookie = cookie # 登录态Cookie(用于评价等需登录的内容)
def _get_headers(self) -> Dict[str, str]:
"""生成随机请求头"""
headers = {
"User-Agent": self.ua.random,
"Referer": "https://www.fuzhuang.com/category/",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"
}
if self.cookie:
headers["Cookie"] = self.cookie
return headers
def _get_proxy(self) -> Dict[str, str]:
"""随机获取代理"""
if self.proxy_pool and len(self.proxy_pool) > 0:
proxy = random.choice(self.proxy_pool)
return {"http": proxy, "https": proxy}
return None
def _clean_price(self, price_str: str) -> float:
"""清洗价格字符串(去除¥、逗号等)"""
if not price_str:
return 0.0
price_str = re.sub(r"[^d.]", "", price_str)
return float(price_str) if price_str else 0.0
def _parse_size_table(self, size_data: Dict) -> List[Dict]:
"""解析尺码表数据(如肩宽、胸围)"""
if not size_data.get("data"):
return []
table = size_data["data"].get("table", [])
# 转换为[{ "尺码": "S", "肩宽": "36cm", ... }, ...]
return [dict(zip(table[0], row)) for row in table[1:]] if table else []
def _parse_static_data(self, html: str) -> Dict:
"""解析主页面静态数据"""
soup = BeautifulSoup(html, "lxml")
# 提取颜色选项(含颜色图)
color_list = []
for color_item in soup.select("div.color-select .color-item"):
color_name = color_item.get("data-color") or ""
color_img = color_item.select_one("img")?.get("src") or ""
color_list.append({"name": color_name, "image": color_img})
# 提取尺码选项(名称)
size_names = [size.get("data-size") for size in soup.select("div.size-select .size-item") if size.get("data-size")]
# 提取材质成分(清洗文本)
material = soup.select_one("div.material")?.text.strip() or ""
material = re.sub(r"s+", " ", material) # 去除多余空格
return {
"title": soup.select_one("h1.goods-title")?.text.strip() or "",
"images": {
"main": [img.get("src") for img in soup.select("div.main-gallery img") if img.get("src")],
"detail": [img.get("src") for img in soup.select("div.detail-images img") if img.get("src")],
"style": [img.get("src") for img in soup.select("div.style-show img") if img.get("src")]
},
"price": {
"current": self._clean_price(soup.select_one("div.price-current")?.text or ""),
"original": self._clean_price(soup.select_one("div.price-original")?.text or ""),
"discount": soup.select_one("div.discount-tag")?.text.strip() or "",
"member_price": self._clean_price(soup.select_one("div.member-price")?.text or "")
},
"brand": soup.select_one("div.brand-name a")?.text.strip() or "",
"material": material,
"style_tags": [tag.text.strip() for tag in soup.select("div.style-tags span")],
"specs": {
"colors": color_list,
"size_names": size_names
},
"user_feedback": {
"rating": float(soup.select_one("div.average-rating")?.text or "0"),
"comment_count": int(re.search(r"d+", soup.select_one("div.comment-count")?.text or "0").group()) if soup.select_one("div.comment-count") else 0
}
}
def _parse_comments(self, html: str) -> List[Dict]:
"""解析用户评价(含尺码建议)"""
soup = BeautifulSoup(html, "lxml")
comments = []
for item in soup.select("div.comment-item")[:5]: # 取前5条
user_info = item.select_one("div.user-info")?.text.strip() or "匿名用户"
# 提取用户体型(如“165cm/50kg”)
body_type = re.search(r"d+cm/d+kg", user_info).group() if re.search(r"d+cm/d+kg", user_info) else ""
# 提取购买的规格(颜色+尺码)
buy_spec = item.select_one("div.buy-spec")?.text.strip() or ""
# 提取评价内容
content = item.select_one("div.comment-content")?.text.strip() or ""
# 提取尺码建议(如“偏大一码”)
size_suggest = ""
if "码" in content:
suggest_match = re.search(r"(偏大|偏小|正常).*?码", content)
size_suggest = suggest_match.group() if suggest_match else ""
# 提取晒图
images = [img.get("src") for img in item.select("div.comment-images img") if img.get("src")]
comments.append({
"user": user_info,
"body_type": body_type,
"buy_spec": buy_spec,
"content": content,
"size_suggest": size_suggest,
"images": images
})
return comments
def _fetch_dynamic_data(self, item_id: str, headers: Dict[str, str], proxy: Dict[str, str]) -> Dict:
"""调用动态接口获取库存和尺码表"""
dynamic_data = {
"stock": {"skus": [], "total_stock": 0},
"size_table": []
}
try:
# 1. 获取库存数据
stock_params = {"item_id": item_id}
stock_resp = requests.get(
self.stock_api,
params=stock_params,
headers=headers,
proxies=proxy,
timeout=10
)
stock_data = stock_resp.json()
if stock_data.get("code") == 0 and "data" in stock_data:
dynamic_data["stock"] = stock_data["data"]
# 2. 获取尺码表
size_params = {"item_id": item_id}
size_resp = requests.get(
self.size_table_api,
params=size_params,
headers=headers,
proxies=proxy,
timeout=10
)
size_data = size_resp.json()
dynamic_data["size_table"] = self._parse_size_table(size_data)
except Exception as e:
print(f"动态数据获取失败: {str(e)}")
return dynamic_data
def _merge_specs_and_stock(self, static_specs: Dict, stock_data: Dict) -> List[Dict]:
"""合并颜色、尺码与库存数据"""
colors = static_specs["colors"]
size_names = static_specs["size_names"]
skus = stock_data.get("skus", [])
# 按颜色分组库存
color_stock_map = {}
for sku in skus:
color = sku["color"]
if color not in color_stock_map:
color_stock_map[color] = []
color_stock_map[color].append(sku)
# 合并颜色与对应尺码库存
merged_colors = []
for color in colors:
color_name = color["name"]
color_image = color["image"]
# 获取该颜色的所有尺码库存
color_skus = color_stock_map.get(color_name, [])
# 关联尺码名称(确保顺序与页面一致)
sizes = []
for size_name in size_names:
# 查找该颜色+尺码的库存
sku_match = next((s for s in color_skus if s["size"] == size_name), None)
if sku_match:
sizes.append({
"name": size_name,
"stock": sku_match["stock"],
"sku_id": sku_match["sku_id"],
"available": sku_match["stock"] > 0
})
else:
sizes.append({
"name": size_name,
"stock": 0,
"sku_id": "",
"available": False
})
merged_colors.append({
"name": color_name,
"image": color_image,
"sizes": sizes
})
return merged_colors
def item_get(self, item_id: str, timeout: int = 10) -> Dict:
"""
获取服装网商品详情
:param item_id: 商品ID(如123456、CLOTH202409)
:param timeout: 超时时间
:return: 标准化商品数据
"""
try:
# 1. 主页面请求
url = self.base_url.format(item_id=item_id)
headers = self._get_headers()
proxy = self._get_proxy()
# 随机延迟,避免反爬
time.sleep(random.uniform(1.5, 3))
response = requests.get(
url=url,
headers=headers,
proxies=proxy,
timeout=timeout
)
response.raise_for_status()
main_html = response.text
# 2. 解析主页面数据
static_data = self._parse_static_data(main_html)
if not static_data["title"]:
return {"success": False, "error_msg": "商品不存在或已下架"}
# 3. 解析用户评价
comments = self._parse_comments(main_html)
static_data["user_feedback"]["comments"] = comments
# 提取尺码建议汇总
size_suggestions = [c["size_suggest"] for c in comments if c["size_suggest"]]
static_data["user_feedback"]["size_suggestions"] = size_suggestions
# 4. 获取动态数据(库存、尺码表)
dynamic_data = self._fetch_dynamic_data(item_id, headers, proxy)
# 5. 合并规格与库存
merged_colors = self._merge_specs_and_stock(
static_data["specs"],
dynamic_data["stock"]
)
# 6. 整合结果
result = {
"success": True,
"data": {
"item_id": item_id,** static_data,
"specs": {
"colors": merged_colors,
"total_stock": dynamic_data["stock"].get("total_stock", 0)
},
"size_table": dynamic_data["size_table"],
"url": url,
"update_time": time.strftime("%Y-%m-%d %H:%M:%S")
}
}
return result
except requests.exceptions.HTTPError as e:
if "403" in str(e):
return {"success": False, "error_msg": "触发反爬,建议更换代理或Cookie", "code": 403}
return {"success": False, "error_msg": f"HTTP错误: {str(e)}", "code": response.status_code}
except Exception as e:
return {"success": False, "error_msg": f"获取失败: {str(e)}", "code": -1}
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
# 使用示例
if __name__ == "__main__":
# 代理池(替换为有效代理)
PROXIES = [
"http://123.45.67.89:8888",
"http://98.76.54.32:8080"
]
# 登录态Cookie(从浏览器获取,用于评价等内容)
COOKIE = "session_id=xxx; user_id=xxx"
# 初始化API客户端
api = FuzhuangItemApi(proxy_pool=PROXIES, cookie=COOKIE)
# 获取商品详情(示例item_id)
item_id = "123456" # 替换为实际商品ID
result = api.item_get(item_id)
if result["success"]:
data = result["data"]
print(f"商品标题: {data['title']}")
print(f"价格: 当前¥{data['price']['current']} | 原价¥{data['price']['original']} | 优惠: {data['price']['discount']}")
print(f"品牌: {data['brand']} | 材质: {data['material']} | 风格: {', '.join(data['style_tags'])}")
print(f"用户评分: {data['user_feedback']['rating']}分 | 评价数: {data['user_feedback']['comment_count']}条")
print(f"颜色选项: {', '.join([c['name'] for c in data['specs']['colors']])}")
print(f"可购规格示例({data['specs']['colors'][0]['name']}):")
for size in data['specs']['colors'][0]['sizes'][:3]:
status = "有货" if size['available'] else "无货"
print(f" 尺码{size['name']}: {size['stock']}件({status})")
print(f"核心尺码表:")
if data['size_table']:
for row in data['size_table'][:3]: # 打印前3行
print(f" {row['尺码']}: 肩宽{row.get('肩宽', '')} | 胸围{row.get('胸围', '')} | 衣长{row.get('衣长', '')}")
print(f"用户尺码建议: {', '.join(data['user_feedback']['size_suggestions'][:3])}")
else:
print(f"获取失败: {result['error_msg']}(错误码: {result.get('code')})")
五、关键技术难点与解决方案
尺码表解析与标准化
问题:服装尺码表格式多样(表格 / 文本),参数命名不统一(如 “衣长” vs “长度”),且包含单位(cm/inch),提取和比对难度大。解决方案:
优先调用动态尺码表接口(结构化数据),若接口不可用则解析页面表格,用转换为标准字典;建立核心参数映射表(如 “衣长”“长度” 统一为 “衣长”),去除单位仅保留数值(便于后续对比);示例代码中
pandas函数将表格数据转换为标准化列表,支持直接提取 “肩宽”“胸围” 等关键参数。
_parse_size_table
颜色 – 尺码库存关联
问题:服装商品的库存以 “颜色 + 尺码” 组合为单位(如黑色 – S、米色 – M),需将静态颜色 / 尺码选项与动态库存数据精准关联,避免匹配错误。解决方案:
从静态页面提取颜色名称和尺码名称,作为基础维度;从库存接口获取列表,按颜色分组构建映射表(
sku);遍历静态颜色列表,为每个颜色匹配对应的尺码库存,标记 “有货 / 无货” 状态(
color_stock_map字段);示例代码中
available函数实现完整关联逻辑,确保库存数据与页面选项一一对应。
_merge_specs_and_stock
用户评价中的尺码建议提取
问题:用户评价中的 “尺码建议”(如 “偏大一码”“165cm 选 M 码”)是服装决策的关键数据,但分散在文本中,需精准提取。解决方案:
用正则匹配关键词(如 “偏大”“偏小”“码”),提取结构化建议(如字段);关联用户体型信息(如 “165cm/50kg”),为尺码推荐系统提供参考;对评价内容进行情感分析(正面 / 负面),结合尺码建议形成综合决策数据。
size_suggest
反爬机制对抗
问题:服装网对商品数据爬取限制严格,高频请求会触发 IP 封锁(403 错误),尤其针对多图商品(图片 URL 易被识别)。解决方案:
代理 IP 轮换:使用高匿代理池,每 2-3 次请求切换 IP,优先选择国内 IP(服装网用户以国内为主);请求频率控制:单 IP 每分钟请求≤3 次,两次请求间隔 2-4 秒(模拟用户浏览服装详情的节奏);图片 URL 处理:爬取图片时添加随机延迟(1-2 秒),避免因批量下载图片触发反爬;Cookie 池策略:维护多个登录态 Cookie,随机携带以降低单一账号风险,尤其在获取用户评价时。
六、最佳实践与合规要点
系统架构设计采用 “轻量采集 + 图片缓存” 架构,适配服装类商品特性:
采集层:集成代理池、Cookie 池,控制图片下载频率,避免触发反爬;解析层:分离基础信息与动态数据解析逻辑,重点处理尺码表与库存关联;存储层:用 Redis 缓存商品基础信息(1 小时过期,价格波动较快),对象存储(如 OSS)缓存图片(长期有效);监控层:实时监控请求成功率、库存数据完整度,异常时通过邮件告警。
性能优化策略
异步批量获取:使用并发处理多个
aiohttp(控制并发数≤3),提升效率;按需解析:列表页优先提取
item_id、价格、主图等核心字段,详细尺码表和评价通过后续
item_id接口补充;图片懒加载:非必要图片(如细节图)可延迟下载,优先保证文字数据获取速度。
item_get
合规性与风险控制
频率限制:单 IP 日请求量≤500 次,避免对服务器造成压力,符合平台 robots 协议;数据使用边界:不得将用户评价、晒图用于商业售卖或恶意竞争,需注明数据来源 “服装网”;图片版权:服装图片可能涉及品牌版权,使用时需遵守《著作权法》,不得擅自用于商业宣传。
七、总结
服装网接口的对接核心在于颜色 – 尺码库存的精准关联、尺码表的标准化解析及用户评价中决策信息的提取。开发者需重点关注:
item_get
二维规格(颜色 + 尺码)与库存数据的匹配逻辑(确保可购状态准确);尺码表和用户建议的结构化处理(辅助消费决策);图片爬取的反爬策略(避免因多图下载触发封锁)。
通过本文的技术方案,可构建稳定的商品详情获取系统,为服装电商、时尚分析等场景提供可靠数据支持。实际应用中,需根据平台最新页面结构动态调整解析规则,平衡数据获取效率与合规性














暂无评论内容