# %% [markdown] cell-5e351e7966a3
## 🕐请从本地上传一个用电商记插件采集的下拉词Excel文件(含淘宝、拼多多、京东)。[下载示例](https://www.dianshangji.cn/u/user5344/cfiles/browse/index?fid=3)
# %%--- [html] cell-a5b79fdf3c10
# properties:
#   run_on_load: true
#   top_hidden: true
# ---%%
请上传一个Excel文件:<input class="btn btn-primary" type="file" id="fileInput" multiple />
# %%--- [python] cell-f74e05782eef
# properties:
#   run_on_load: true
#   top_hidden: true
# ---%%
print("开始初始化数据分析和可视化的运行环境,请稍候……")
import micropip
await micropip.install("/pypi/openpyxl-3.1.5-py2.py3-none-any.whl")
await micropip.install("/pypi/pyfonts-0.0.2-py3-none-any.whl")
import pandas as pd
import pyodide
from pyfonts import load_font

# 文件的URL
file_url = '/assets/fonts/NotoSansSC-Regular.ttf'  # 请将此URL替换为实际文件的URL
# 本地保存路径
local_file_path = '/NotoSansSC-Regular.ttf'
# 下载文件并保存到本地
try:
	response = await pyodide.http.pyfetch(file_url)
	# Return the response body as a bytes object
	image_data = await response.bytes()
	with open(local_file_path, 'wb') as f:
		f.write(image_data)
	print(f"中文字体已成功下载并保存为: {local_file_path}")
except Exception as e:
	print(f"下载文件时出错: {e}")

font = load_font(font_path="/NotoSansSC-Regular.ttf")
print("数据分析和可视化的运行环境已经就绪。可以进行第1步了。")
# %%--- [javascript] cell-d28877a258f5
# properties:
#   run_on_load: true
#   top_hidden: true
# ---%%
const fileInput = document.getElementById('fileInput');

async function uploadFile(){
	const file = fileInput.files[0];
    if (!file) {
        alert("Please select a file first.");
        return;
    }
    
    // 读取文件为 ArrayBuffer
    const arrayBuffer = await file.arrayBuffer();
    
    // 将 ArrayBuffer 转换为 Uint8Array
    const uint8Array = new Uint8Array(arrayBuffer);
    
    pyodide.FS.writeFile('/file1.xlsx', uint8Array);  
  	alert('Excel数据已上传至内存文件: /file1.xlsx\n请运行下一个单元格:数据清洗与预处理');
}

if (fileInput.files.length !== 1) {
    alert("请上传一个用电商记插件采集的下拉词Excel文件");
    fileInput.addEventListener('change', uploadFile);
    return;    
}
uploadFile();

# %% [markdown] cell-ae34ad367f8e
## 🕑数据清洗与预处理
# %% [python] cell-b5f6355a74d9
print("开始读取内存中的Excel文件……")
# 读取Excel文件,跳过前两行(即从第三行开始读取),只保留“关键词”、“下拉词”和“平台”三个字段
excel_file_path = '/file1.xlsx'

df = pd.read_excel(excel_file_path, skiprows=2, usecols=['关键词','下拉词', '平台'])

print(df.head(5))

import io
# 使用StringIO和to_csv将DataFrame转换为CSV文本
csv_data = io.StringIO()
df.to_csv(csv_data, index=False)

# 获取CSV文本内容
csv_text = csv_data.getvalue()

# 记得关闭 StringIO 对象
csv_data.close()

import js

js.window.openNotebookAssistant('cell-09c9b7faff90', 'markdown', '你是一个商业分析师,请解读下面的CSV格式的数据,它采集自淘宝、拼多多、京东,有三个字段:关键词、相应的下拉词、数据来自哪个平台。你的任务是根据这份数据,详细编写市场研究报告。\n' + csv_text)
# %% [markdown] cell-09c9b7faff90
### 市场研究报告:淘宝、拼多多、京东电商平台的服装关键词及下拉词分析

#### 1. 数据概述
本次报告基于从淘宝、拼多多和京东三个电商平台采集的服装类商品关键词及其下拉词数据,涵盖了牛仔裤、牛仔裙、T恤、衬衫、休闲鞋和卫衣六个主要类别。每个关键词的下拉词反映了消费者在搜索该关键词时可能感兴趣的细分产品或风格。

#### 2. 平台差异分析
不同平台的用户需求和市场定位存在显著差异,通过对比各平台的数据可以发现以下特点:

- **淘宝**:
  - 关键词和下拉词较为多样化,涵盖多种款式、季节、适用人群等。
  - 例如,“牛仔裤”下拉词包括男款、女款、加绒、直筒等多种选择。
  - 用户偏好时尚、个性化的商品,注重款式和设计感。

- **拼多多**:
  - 强调性价比和实用性,许多下拉词涉及价格区间、材质(如纯棉)、年龄段等。
  - 例如,“牛仔裤”下拉词中多次出现“40到50岁”、“高弹力”、“薄款”等描述。
  - 用户更关注产品的实用性和价格优势,适合追求高性价比的消费群体。

- **京东**:
  - 注重品质和服务保障,自营旗舰店的产品较多。
  - 例如,“牛仔裤”下拉词中有多个提及“京东自营旗舰店”、“法式”、“修身”等。
  - 用户对品牌和质量有较高要求,偏好高品质的商品。

#### 3. 商品类别分析
针对各个商品类别,我们可以进一步分析其市场趋势和用户需求:

- **牛仔裤**:
  - **淘宝**:用户更关注款式多样性和个性化,如“微喇”、“阔腿宽松”、“小个子”等。
  - **拼多多**:用户注重实用性和性价比,如“男士加绒加厚”、“耐磨”、“40到50岁”等。
  - **京东**:用户对品质和服务有较高要求,如“自营旗舰店”、“修身”、“复古”等。

- **牛仔裙**:
  - **淘宝**:用户偏好轻奢高级感的设计,如“连衣裙轻奢高级感”、“套装”等。
  - **拼多多**:用户更多关注款式和价格,如“新款爆款”、“中长款”等。
  - **京东**:用户注重品质和搭配,如“半身裙女微胖”、“连衣裙”等。

- **T恤**:
  - **淘宝**:用户关注款式和个性化设计,如“连衣裙”、“定制”等。
  - **拼多多**:用户更注重材质和性价比,如“纯棉”、“短袖”等。
  - **京东**:用户对品牌和质量有较高要求,如“自营旗舰店”、“高档次”等。

- **衬衫**:
  - **淘宝**:用户偏好个性化设计,如“朋克风”、“禁欲系”等。
  - **拼多多**:用户更关注实用性和价格,如“加绒”、“内搭”等。
  - **京东**:用户注重品质和场合适用性,如“商务正装”、“欧美风”等。

- **休闲鞋**:
  - **淘宝**:用户关注款式和时尚感,如“百搭”、“运动风”等。
  - **拼多多**:用户更注重性价比和功能性,如“防臭”、“软底”等。
  - **京东**:用户对品质和服务有较高要求,如“自营旗舰店”、“真皮”等。

- **卫衣**:
  - **淘宝**:用户关注款式和个性化设计,如“连帽”、“套装”等。
  - **拼多多**:用户更注重材质和性价比,如“加绒”、“纯棉”等。
  - **京东**:用户对品质和设计有较高要求,如“秋冬慵懒风”、“高街加绒”等。

#### 4. 结论与建议
通过对淘宝、拼多多和京东三个平台的关键词及下拉词数据分析,我们可以得出以下结论:

- **淘宝**:适合推广时尚、个性化且款式多样的商品,满足年轻消费者对新鲜感和独特性的追求。
- **拼多多**:应注重性价比和实用性,推出高性价比的产品,吸引追求实惠的用户。
- **京东**:适合推广高品质、品牌化的产品,强调服务保障和用户体验,吸引注重品质的消费者。

根据这些结论,商家可以根据目标平台的特点调整营销策略,优化产品线,以更好地满足用户需求并提升市场竞争力。