Name: alicloud-ai-multimodal-qwen-omni
Availability: InStock
Author: cinience

System Documentation

What problem does it solve?

This Skill addresses the need for comprehensive multimodal understanding and generation, enabling AI to process and interact with various data types simultaneously.

Core Features & Use Cases

Multimodal Input: Accepts text, images, and audio as input.
Multimodal Output: Can generate text and audio responses.
Use Case: Powering a voice assistant that can describe an image, answer questions about it, and respond verbally.

Quick Start

Use the alicloud-ai-multimodal-qwen-omni skill to describe the provided image and respond in Chinese.

Please help me install this Skill: Name: alicloud-ai-multimodal-qwen-omni Download link: https://github.com/cinience/alicloud-skills/archive/main.zip#alicloud-ai-multimodal-qwen-omni Please download this .zip file, extract it, and install it in the .claude/skills/ directory.

alicloud-ai-multimodal-qwen-omni

System Documentation

What problem does it solve?

Core Features & Use Cases

Quick Start

Dependency Matrix

Required Modules

Components

💻 Claude Code Installation

Agent Skills Search Helper