ホーム/数据 & AI/alicloud-ai-audio-tts-voice-design

alicloud-ai-audio-tts-voice-design

Name: alicloud-ai-audio-tts-voice-design AI Agent Skill
Rating: 4.6 (125 reviews)
Author: cinience

by @ciniencev

4.6(125)

Alibaba Cloud Model StudioのQwen TTS音声デザインサービスを提供し、自然言語記述を通じて制御可能な合成音声を生成します。

Alibaba Cloud AITTSText-to-SpeechVoice SynthesisAudio DesignGitHub

インストール方法

npx skills add cinience/alicloud-skills --skill alicloud-ai-audio-tts-voice-design

compare_arrows

Before / After 効果比較

1 组

使用前

従来のテキスト読み上げ（TTS）サービスで生成される音声は、個性や感情表現に乏しく、特定のニーズに合わせて細かく調整することが困難でした。聴き心地が不自然で、応用シーンが限られていました。

使用後

Alibaba Cloud Model Studio Qwen TTS音声設計モデルを採用することで、自然言語記述を通じて高度に制御可能な合成音声を生成し、音声のパーソナライズと感情表現を実現します。これにより、ユーザーエクスペリエンスとアプリケーションの柔軟性が大幅に向上します。

description SKILL.md

alicloud-ai-audio-tts-voice-design

Category: provider

Model Studio Qwen TTS Voice Design

Use voice design models to create controllable synthetic voices from natural language descriptions.

Critical model names

Use one of these exact model strings:

qwen3-tts-vd-2026-01-26
qwen3-tts-vd-realtime-2026-01-15

Prerequisites

Install SDK in a virtual environment:

python3 -m venv .venv
. .venv/bin/activate
python -m pip install dashscope

Set DASHSCOPE_API_KEY in your environment, or add dashscope_api_key to ~/.alibabacloud/credentials.

Normalized interface (tts.voice_design)

Request

voice_prompt (string, required) target voice description
text (string, required)
stream (bool, optional)

Response

audio_url (string) or streaming PCM chunks
voice_id (string)
request_id (string)

Operational guidance

Write voice prompts with tone, pace, emotion, and timbre constraints.
Build a reusable voice prompt library for product consistency.
Validate generated voice in short utterances before long scripts.

Local helper script

Prepare a normalized request JSON and validate response schema:

.venv/bin/python skills/ai/audio/alicloud-ai-audio-tts-voice-design/scripts/prepare_voice_design_request.py \
  --voice-prompt "A warm female host voice, clear articulation, medium pace" \
  --text "This is a voice-design demo"

Output location

Default output: output/ai-audio-tts-voice-design/audio/
Override base dir with OUTPUT_DIR.

Validation

mkdir -p output/alicloud-ai-audio-tts-voice-design
for f in skills/ai/audio/alicloud-ai-audio-tts-voice-design/scripts/*.py; do
  python3 -m py_compile "$f"
done
echo "py_compile_ok" > output/alicloud-ai-audio-tts-voice-design/validate.txt

Pass criteria: command exits 0 and output/alicloud-ai-audio-tts-voice-design/validate.txt is generated.

Output And Evidence

Save artifacts, command outputs, and API response summaries under output/alicloud-ai-audio-tts-voice-design/.
Include key parameters (region/resource id/time range) in evidence files for reproducibility.

Workflow

Confirm user intent, region, identifiers, and whether the operation is read-only or mutating.
Run one minimal read-only query first to verify connectivity and permissions.
Execute the target operation with explicit parameters and bounded scope.
Verify results and save output/evidence files.

References

references/sources.md

Weekly Installs226Repositorycinience/alicloud-skillsGitHub Stars357First SeenFeb 26, 2026Security AuditsGen Agent Trust HubPass SocketPass SnykPassInstalled ongemini-cli224github-copilot224codex224kimi-cli224amp224cursor224

forumユーザーレビュー (0)

レビューを書く

効果

使いやすさ

ドキュメント

互換性

レビューなし

統計データ

インストール数3.3K

評価4.6 / 5.0

バージョン

更新日2026年3月17日

比較事例1 件

ユーザー評価

4.6(125)

この Skill を評価

0.0

対応プラットフォーム

🔧Claude Code

🔧OpenClaw

🔧OpenCode

🔧Codex

🔧Gemini CLI

🔧GitHub Copilot

🔧Amp

🔧Kimi CLI

タイムライン

作成2026年3月17日

最終更新2026年3月17日