广告发布网站模板四川电子有限公司 - 手机网站
2026/3/28 22:00:26 网站建设 项目流程
广告发布网站模板,四川电子有限公司 - 手机网站,校园网站建设促进教学,wordpress 环境搭建数十年来#xff0c;图形用户界面一直占据主流地位#xff0c;如今用户愈发期望能与应用程序直接对话交流。Amazon Nova Sonic是Amazon Bedrock上一款先进基础模型#xff08;FM#xff09;#xff0c;它通过简洁的流式API实现自然流畅、低延迟的双向语音对话功能#xf…数十年来图形用户界面一直占据主流地位如今用户愈发期望能与应用程序直接对话交流。Amazon Nova Sonic是Amazon Bedrock上一款先进基础模型FM它通过简洁的流式API实现自然流畅、低延迟的双向语音对话功能助力实现这一愿景。用户不再是单纯操作应用而是能够借助语音与嵌入式智能与应用程序展开协作。本文将以一款智能待办AppSmart Todo App为例介绍为应用程序打造真正以语音为核心的交互体验将常规任务管理转化为流畅便捷的免提式语音对话流程。基于协作式AI语音助手重新定义用户交互模式在产品开发过程中一些对提升用户体验至关重要的改进往往会被置于次要地位。这并非因为它们缺乏价值而是由于在传统键鼠交互模式下这些功能改进的实现难度较大。诸如智能批量操作、个性化工作流设置、语音引导辅助等功能常常因用户界面的复杂性陷入反复研讨却迟迟无法落地的困境。需要明确的是语音交互是一种额外的通用交互模式它既不会取代设备原有的特定操控方式也绝非仅仅是为有特殊需求的用户提供无障碍解决方案。语音技术不仅能催生全新的交互模式还能为屏幕阅读器等辅助技术使用者提供一种更加包容、多元的交互途径让这些用户也能顺畅地与应用程序进行互动。Amazon Nova Sonic远不止能处理单次语音指令该模型能够规划多步骤工作流、调用后端工具并在多轮对话中维持上下文连贯性让应用程序能够与用户展开高效协作。下表展示了任务管理、客户关系管理CRM、技术支持中心等不同应用领域的语音交互示例。Amazon Nova Sonic可精准识别用户意图、调用所需API并向用户反馈确认执行结果全程无需填写任何表单。这有助于打造一个效率倍增的全新应用环境其中交互不再依赖传统的界面元素而是以具体的上下文信息作为交互的核心依据。需要明确的是它并非要用语音取代传统用户界面而是致力于通过语音技术为用户解锁更多全新的功能体验。示例应用概览借助智能待办App用户可创建待办事项清单并在清单内管理相关笔记。该应用提供了一个简洁灵活的交互界面便于用户跟踪任务进度和整理笔记内容。集成语音功能后这款应用实现了免提操作模式让用户能够获得更自然更高效的交互体验。在该应用中用户只需开口下达指令例如添加一条备注提醒我跟进项目章程的相关事宜归档所有已完成的任务每一条指令背后都对应着一系列精准的操作例如新建笔记、整理内容或更新任务状态等这些操作均通过语音指令完成整个过程自然流畅、高效便捷。Amazon Nova Sonic双向API的工作原理Amazon Nova Sonic采用实时双向流式传输架构。通过InvokeModelWithBidirectionalStream启动会话后音频输入与模型响应将依托持续连接的数据流实现同步传输。1.会话启动客户端发送一个包含模型配置如温度系数、topP参数的sessionStart事件。2.提示词与内容启动客户端发送结构化事件用于标识后续传输的数据类型为音频、文本还是工具输入。3.音频流式传输麦克风采集的音频以base64编码的音频输入事件形式进行流式传输。4.模型响应模型在处理输入的过程中会异步流式返回以下响应内容自动语音识别ASR结果工具调用指令文本响应用于播放的音频输出5.会话结束客户端发送contentEnd、promptEnd及sessionEnd事件来终止会话。Amazon Nova Sonic架构图借助这种事件驱动型的架构用户能够在语音助手输出内容时打断它实现中途插入操作轻松开启多轮对话还能让系统根据实时情况动态调整适配。解决方案架构本解决方案采用无服务器应用架构模式其中用户界面为一款React单页应用。该React单页应用与运行在服务端容器的后端Web API相集成。智能待办APP基于一套兼具可扩展性与安全性的亚马逊云科技架构进行部署该架构专为支持实时语音交互而设计。下图展示了各项亚马逊云科技服务如何协作以满足语音应用双向流传输需求的架构概览。该解决方案架构包括以下核心亚马逊云科技服务1.Amazon Bedrock基于Amazon Nova Sonic基础模型实现实时双向语音交互。2.Amazon CloudFront一款可低延迟分发应用至全球各地的内容分发网络CDN。该服务将/(root)流量路由至托管于Amazon S3存储桶中的React前端应用同时将/api和/novasonic路径流量路由至应用负载均衡器Application Load BalancerALB。3.Amazon Fargate for Amazon ECS运行后端容器化服务负责处理WebSocket连接及支持长连接双向流式传输的REST API。4.应用负载均衡器ALB将Web流量/apiHTTPS REST API调用转发至负责处理智能待办应用API的后端ECS服务同时将/novasonicWebSocket连接转发至基于Amazon Nova Sonic管理实时语音流的ECS服务。5.Amazon VPC为后端服务提供网络隔离与安全防护。公有子网托管应用负载均衡器私有子网则部署运行WebSocket和REST API的ECS Fargate任务。6.NAT网关允许私有子网内的Amazon ECS任务更安全地访问互联网以执行诸如Cognito JWT token验证端点等操作。7.Amazon S3托管用于用户交互的React前端应用。8.Amazon WAF助力防护应用负载均衡器免受恶意流量侵袭并在应用层强制执行安全规则。9.Amazon Cognito负责身份验证管理及token签发。10.Amazon DynamoDB存储待办事项清单、笔记等应用数据。下图展示了系统如何支持低延迟双向流式传输从而响应用户请求的处理流程。请求处理工作流部署解决方案如需评估本解决方案您可参阅GitHub代码库中提供的智能待办APP的示例代码。GitHub代码库https://github.com/aws-samples/sample-amazon-q-developer-vibe-coded-projects/tree/main/NovaSonicVoiceAssistant智能待办APP由多个相互独立的Node.js项目构成其中包括一个CDK基础设施项目、一个React前端应用以及后端API服务。该部署流程可确保正确构建各类组件并集成Amazon Cognito、Amazon DynamoDB、Amazon Bedrock等亚马逊云科技服务。准备条件1.具备相应权限的亚马逊云科技账户需遵循安全最佳实践包括最小权限原则。2.本地已安装并运行Docker Engine用于在本地构建容器镜像。3.Amazon Web Services CLI已配置亚马逊云科技管理员凭证。4.已安装Node.js版本≥20.x及npm。5.已在Amazon Bedrock中启用Amazon Nova Sonic。更多信息请参阅《添加或移除对Amazon Bedrock基础模型的访问权限》。《添加或移除对Amazon Bedrock基础模型的访问权限》https://docs.aws.amazon.com/bedrock/latest/userguide/model-access-modify.html部署步骤1.克隆以下代码库。git clone https://github.com/aws-samples/sample-amazon-q-developer-vibe-coded-projects.gitcd NovaSonicVoiceAssistant左右滑动查看完整示意2.首次部署时请执行以下自动化脚本。npm run deploy:first-time左右滑动查看完整示意该脚本将执行以下操作使用npmNode包管理器安装依赖包。借助本地已安装的Docker Engine构建组件及容器镜像。使用CDK部署基础设施执行流程为CDK BootStrap→CDK Synth→CDK Deploy。使用Amazon Cognito的设置更新环境变量。基于更新后的环境变量重新构建用户界面。部署最终的基础设施执行CDK Deploy。验证部署结果部署成功后请完成以下步骤1.访问CDK输出结果中提供的Amazon CloudFront网址。注图示网址仅供参考每次部署都会生成唯一专属网址。部署成功的截图2.通过注册板块创建账户完成创建新用户。创建用户并登录3.测试语音功能以验证其与Amazon Nova Sonic的集成效果。下图展示了已登录用户与Amazon Bedrock Agent的对话交互过程。该AI Agent可调用现有API用户界面也会实时更新以同步呈现Agent的操作状态。为应用程序授予麦克风访问权限智能待办App中的语音交互功能清理您可以使用以下命令来移除这些堆栈。# move to the infra folder, assuming you are in the project’s root foldercd infra# Removes the AWS stacknpm run destroy左右滑动查看完整示意后续步骤语音绝非仅仅是为提升无障碍体验而增设的附加项它正日益成为复杂业务流程中的核心交互方式。事实证明通过语音交流的效率远高于手动选择操作特别是在应用能进行语音反馈的情况下这种优势更为显著。您可借助以下资源开启探索之旅示例代码库提供可直接在本地运行的Amazon Nova Sonic完整集成方案您可从中了解实时语音交互、意图识别及多步骤流程的端到端实现方法。Amazon Nova Sonic hands-on workshop这项引导式实验课程将指导您在个人亚马逊云科技账户中部署Amazon Nova Sonic以及测试原生语音功能。Amazon Nova Sonic文档涵盖API参考、流式传输示例及最佳实践方案帮助您设计并部署语音驱动的工作流程。示例代码库https://github.com/aws-samples/sample-amazon-q-developer-vibe-coded-projects/tree/main/NovaSonicVoiceAssistantAmazon Nova Sonic hands-on workshophttps://catalog.us-east-1.prod.workshops.aws/workshops/5238419f-1337-4e0f-8cd7-02239486c40d/en-USAmazon Nova Sonic文档https://docs.aws.amazon.com/nova/latest/userguide/speech.html本篇作者Manu Mishra亚马逊云科技的高级解决方案架构师专注于AI、数据与分析及安全领域。他的专业能力覆盖战略规划与实操技术指导负责审阅并指导内部团队工作及外部客户项目。Manu致力于携手亚马逊云科技客户制定技术战略助力达成高价值的业务成果确保技术方案与企业目标高度契合。AK Soni亚马逊云科技企业级技术支持团队的高级技术客户经理。他凭借前瞻性指导协助企业客户落地符合行业最佳实践的创新云技和人工智能与机器学习解决方案助力客户达成业务目标。他拥有超过19年的企业应用架构与开发经验凭借在生成式AI技术领域的专业能力助力客户优化业务运营突破现有技术瓶颈。Raj Bagwe亚马逊云科技的高级解决方案架构师常驻美国加利福尼亚州旧金山。他在亚马逊云科技任职超6年致力于协助客户攻克各类复杂的技术挑战专业领域涵盖云架构设计、安全防护与系统迁移等。新用户注册海外区域账户可获得最高200美元服务抵扣金覆盖Amazon Bedrock生成式AI相关服务。“免费计划”账户类型确保零花费安心试用。星标不迷路开发更极速关注后记得星标「亚马逊云开发者」听说点完下面4个按钮就不会碰到bug了点击阅读原文查看博客获得更详细内容

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询