0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

音视频技术开发之浅析

LiveVideoStack 来源:电子发烧友网 作者:工程师谭军 2018-07-09 14:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Hulu 视频QoS优化策略

QoS直接关系到用户体验,如何提升QoS就成为视频平台技术实力的体现。本文来自Hulu全球高级研发经理、视频编解码与传输领域资深专家傅徳良在LiveVideoStackCon 2017上的分享。尽管Hulu提供服务的网络环境与国内大相径庭,但其相关QoS保障策略依然值得借鉴。

微博短视频服务优化实践

本文来自新浪微博视频转码平台技术负责人李成亚在LiveVideoStackCon 2017上的分享,由LiveVideoStack整理成文。李成亚分享了微博短视频如何提升用户体验、降低成本的思路与实践,包括提升短视频发布速度,降低长视频转码时间,通过新的Codec减少带宽成本等。

熊猫TV直播H5播放器架构探索

本文来自熊猫TV音视频技术专家姜雨晴在LiveVideoStackCon 2017上的分享,并有LiveVideoStack整理成文。当下,打造一款播放器已经有比较好的开源实现,但熊猫TV为什么还要自研一款H5播放器呢?为了保证业务持续扩展能力,需要对播放器做解耦。同时,在播放器上线初期还遇到了音画不同步、故障定位、客户端性能不足等问题。

Dubbo源码分析 -- 远程通信 Netty

Dubbo 做为 RPC 框架,需要进行跨 JVM 通信,要保证高性、稳定的进行远程通信。Dubbo 底层通信选择了 Netty 这个 NIO 框架做为默认的网络通信框架并且通过自定义协议进行通信。

中国电信发布全球首份5G技术白皮书

2018年6月26日,中国电信在2018上海世界移动大会(MWCS)上发布了《中国电信5G技术白皮书》,这也是全球MNO运营商首次发布全面阐述5G技术观点和总体策略的白皮书。

音频开源代码中重采样算法的评估与选择

在音频软件实现中经常会遇到两个模块采样率不一致的情况,比如语音通话时采集到的PCM信号是16k Hz的,但编码时codec是AMR-NB(AMR-NB是8k Hz采样),这时就需要把16k Hz采样的PCM值转换成8k Hz采样的PCM值(这叫降采样或者下采样),然后再去做AMR-NB编码。本文介绍如何评估开源代码里的重采样实现以及选择最适合的实现。

音频/视频技术

Google 实时流拥塞控制算法GCCx1wan

GCC是google实时流拥塞控制算法的简称,已经在WebRTC中实现,应用于Chrome,后面将应用到Hangouts(视频聊天产品)中,主要用于视频流的拥塞控制。

FFmpeg中的scale和crop参数FlyingPenguin

FFmpeg中的libavfilter提供了一整套的基于filter的机制。filter本身是一个插件的形式,可以快速的组装需要的效果。本文简单介绍了通过filter实现视频的水平镜像效果。

iOS中获取音频流并提取pcmCNon

本文简要介绍了两种不同的原始音频流获取方式 AVCaptureSession、AudioUnit,以及如何从AudioUnit获取的原始数据中提取pcm。

用getDisplayMedia实现在Chrome中共享屏幕

Chrome网上商店已决定停止允许Chrome扩展程序的内联安装。这对WebRTC应用程序有相当大的影响,因为Chrome中的屏幕共享目前还需要扩展程序。getDisplayMedia能来解决这个问题吗?本文来自appear.in的WebRTC工程师Philipp Hancke,LiveVideoStack对文章进行了摘译。

编解码

基于镜头的编码

基于镜头的编码比基于主题的编码带来更高的编码效率,由于对内容感知的粒度更加细,这种改变的结果显而易见。然而,更细粒度的编码也会带来更高的负责度,比如在AWS环境中,在基础设施服务失效的情况下,如何最大限度的保留已编码的成果,从而减少重复编码工作。本文来自Netflix的科技博客,LiveVideoStack对原文进行了摘译。

视频编码步入更压缩高性能时代

目前,针对海量多媒体数据的压缩和处理,特别是VR和HDR视频数据,开发并提出新的高性能codec及处理方案是多媒体通信应用行业共同面临的难题。MPEG已经开始着手更新一代视频编解码标准VVC的制定,视频压缩性能有望进一步大幅提高。在此背景下,本文简要梳理一下当前针对大规模多媒体数据的高效压缩技术。

JavaScript 编写 MPEG1 解码器柒缘生活吧

本文主要介绍了用JavaScript编写MPEG1解码器的开发过程中的一系列问题:JSMpeg中实现音频流传输的逻辑组件构成及流程,MPEG内部的YUV格式转换等。

UIImage图片解码的性能优化吴家十三少

用 UIImage 或 CGImageSource 的那几个方法创建图片时,图片数据并不会立刻解码。图片设置到 UIImageView 或者 CALayer.contents 中去,并且 CALayer 被提交到 GPU 前,CGImage 中的数据才会得到解码。本文主要介绍了图片解码时产生的性能问题及优化。

Android音视频系列:H264视频编码介绍

本文从配置编码参数、输入要编码的图像帧、编码数据生成等方面介绍了使用X264开源库编码的H264视频编码技术。

AI智能

简单初始化,训练10000层CNN

如何快速简单地训练神经网络?谷歌大脑研究人员研究了CNN的可训练性,提出了一种简单的初始化策略,不需要使用残差连接或批标准化,就能训练10000层的原始CNN。作者表示,他们的这项工作清除了在训练任意深度的原始卷积网络时存在的所有主要的障碍。

步态识别的深度学习:综述

步态是人在行走过程中姿态的变化.不同于人脸、指纹、虹膜等, 步态是唯一可在远距离非受控状态下获得的生物特征.步态识别指利用步态信息对人的身份进行识别的技术,当前关于步态识别方面的研究综述主要围绕在相关手工特征建模和传统机器学习(非深度学习)的识别算法上.

卷积神经网络的压缩和加速

本文介绍了比较常见的4种卷积神经网络压缩和加速方法,其中网络裁枝与低秩估计的方法从矩阵乘法角度,着眼于减少标量乘法和加法个数来实现模型压缩和加速的;而模型量化则是着眼于参数本身,直接减少每个参数的存储空间,提升每次标量乘法和加法的速度,从而实现模型的压缩和加速;模型蒸馏方法却是从宏观结构入手,直接构造了结构简单,参数少的小网络,将难点转移成对小网络的训练上。

场景文本检测—CTPN算法介绍

对于复杂环境中的字符的识别,主要包括文字检测和文字识别两个步骤,这里介绍的CTPN(Detecting Text in Natural Image with Connectionist Text Proposal Network)方法就是在场景中提取文字的一个效果较好的算法,能将自然环境中的文本信息位置加以检测。

图像

腾讯优图CVPR 2018论文:图片去模糊及快速肖像处理等多项技术解读

在慢速曝光或快速运动拍摄照片时,图像模糊常常困扰着照片拍摄者。腾讯优图实验室的新算法,可以处理非特定场景中的图片模糊。算法基于一种被称为「动态模糊」的模糊模型假设。

使用 MATLAB 图像处理算法,视频实时加持蓝天背景

本文将以色度键控效果为例,介绍在嵌入式硬件上部署 MATLAB 图像处理算法的简单工作流。我们将使用 MATLAB Coder™ 通过算法生成C代码,然后使用在硬件上运行的实用程序在 Raspberry Pi 板卡上进行算法原型验证。最后,我们将算法移植至 NVIDIA Jetson Tx1 平台以保证实时性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1814

    浏览量

    60628
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302576
  • 视频编码
    +关注

    关注

    2

    文章

    115

    浏览量

    21622
  • javascript
    +关注

    关注

    0

    文章

    526

    浏览量

    56523
  • 5G
    5G
    +关注

    关注

    1368

    文章

    49214

    浏览量

    638940

原文标题:音视频技术开发周刊 56期

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    C++实战FFmpeg音视频编码实战屏幕录像机视频课程-基于QT5和ffmpeg sdk

    pan.baidu.com/s/1g64x9D_jp9ufk4uBpQBmvA?pwd=497f QT5+FFmpeg底层实战,为未来音视频产品开发筑牢技术根基 站在2026年的技术
    的头像 发表于 04-21 15:27 573次阅读

    MAX4079:完整的音视频后端解决方案

    MAX4079:完整的音视频后端解决方案 一、引言 在当今的电子设备中,音视频处理是一个关键的环节。无论是卫星接收器、有线电视接收器,还是家庭影院系统、DVD 播放器等,都需要高效可靠的音视频后端
    的头像 发表于 04-03 12:50 227次阅读

    车载音视频系统环境试验方法全解析:从高温到EMC测试

    车载音视频系统环境试验是指通过模拟车辆在实际使用过程中可能遇到的各种极端环境条件(如温度、湿度、振动、电磁干扰等),对车载信息娱乐系统(IVI)、显示屏、音响、摄像头等音视频设备进行可靠性、安全性
    的头像 发表于 03-25 16:49 397次阅读
    车载<b class='flag-5'>音视频</b>系统环境试验方法全解析:从高温到EMC测试

    从 “卡脖子” 到 “自主可控”,音视频分布式系统国产化实践之路

    在当前全球音视频芯片市场格局中,国外企业长期占据主导地位,核心技术与核心器件的垄断的局面,曾是国内音视频行业发展的重要制约因素。近年来,随着国际形势的深刻变化,国外对我国芯片行业的技术
    的头像 发表于 03-02 11:18 346次阅读
    从 “卡脖子” 到 “自主可控”,<b class='flag-5'>音视频</b>分布式系统国产化实践之路

    洲明科技荣获2025年度音视频行业品牌评选九项大奖

    2025年12月20日,由DAV数字音视工程网与《数字音视工程》杂志联合主办的第17届音视频行业品牌评选结果正式揭晓。
    的头像 发表于 12-28 11:45 818次阅读

    打破国外垄断!自主分布式音视频方案筑牢行业安全根基

    在当前的全球音视频芯片市场中,国外公司一直占据着主导地位,然而,近年来国外对中国芯片行业的打压让国内音视频行业的发展面临了巨大的挑战。在这样的背景下,国内领先的音视频技术企业挺身而出,
    的头像 发表于 12-19 11:28 475次阅读
    打破国外垄断!自主分布式<b class='flag-5'>音视频</b>方案筑牢行业安全根基

    专业音视频板卡核心接口科普 + 产品优劣全解析

    ),科普复合视频、DVI、FPDLink 等核心接口特性,同时深度解析各产品的优劣亮点,为选型提供参考(文中附图片建议,便于直观理解)。 一、核心接口科普:技术特性与适用场景 专业音视频接口的核心差异集中在信号类型、传输质量、抗
    的头像 发表于 12-11 17:09 1100次阅读

    三款PXIe板卡科普:解锁专业音视频处理的核心力量

    一、KS-PXIe638:8通道音视频采集的“数据捕捉能手” 在航空航天测控、工业自动化等对数据采集精度要求极高的领域,一款稳定高效的音视频采集板卡至关重要,KS-PXIe638型8通道音视频采集板
    的头像 发表于 12-04 17:04 1019次阅读
    三款PXIe板卡科普:解锁专业<b class='flag-5'>音视频</b>处理的核心力量

    KS-PXIe638 型 8 通道音视频采集板:高清同步采集,专业场景 “性能标杆”

    路同步采集、硬编高效压缩、简易集成优势,成为专业领域的靠谱选,轻松搞定复杂场景下的音视频采集需求! 一、8 路同步采集,音画双高保真 全通道覆盖,音视频同步捕获 :配备 8 路标清视频
    的头像 发表于 11-26 13:24 558次阅读
    KS-PXIe638 型 8 通道<b class='flag-5'>音视频</b>采集板:高清同步采集,专业场景 “性能标杆”

    音视频编解码封装解封装部件介绍

    是否有探索开源鸿蒙音视频编解码技术的欲望?是否对开源鸿蒙音视频编解码格式支持有诉求?别急——今天这份开源鸿蒙AVCodec Kit介绍文章,就是解答疑惑的指南!参考这份指南,可以使用开源鸿蒙的
    的头像 发表于 10-31 09:15 666次阅读
    <b class='flag-5'>音视频</b>编解码封装解封装部件介绍

    音视频开发全栈解析

    Media Kit 让开发者可以调用系统的音视频能力,涵盖播放、录制、录屏、元数据提取与转码六大核心功能模块,支撑系统应用与第三方应用在视频播放、内容创作、教学录屏、直播互动等典型场景下的音视
    的头像 发表于 09-18 14:42 1041次阅读
    <b class='flag-5'>音视频</b><b class='flag-5'>开发</b>全栈解析

    千视电子受邀亮相2025音视频产业链研讨会,引领全链路音视频IP化新趋势

    主管部门负责人,共同探讨产业前沿技术、市场趋势及合作机会,旨在推动湖南音视频产业链高质量发展。当前,全球音视频产业正经历深刻变革,正在加速迈向智能化、融合化及沉浸式体验的新
    的头像 发表于 08-27 11:33 1534次阅读
    千视电子受邀亮相2025<b class='flag-5'>音视频</b>产业链研讨会,引领全链路<b class='flag-5'>音视频</b>IP化新趋势

    泰芯半导体推出星闪音视频无线SOC芯片TXW828

    在短距离无线通信技术加速迭代的浪潮中,珠海泰芯半导体有限公司全球首先发布支持星闪(NearLink)标准的音视频无线SOC芯片——TXW828。这款集WiFi/蓝牙BLE/星闪三模融合音视频无线芯片
    的头像 发表于 06-20 15:51 3056次阅读

    中国音视频产业迈向高质量发展

    随着超高清先锋计划的逐步推进,截至2024年底,中国音视频产业规模超5万亿,包括个人消费电子、家庭影音娱乐、行业多媒体应用及车载视听产业和相关衍生应用等行业企业超过百万家,音视频产业已经成为国家数字经济发展的重要支柱。
    的头像 发表于 04-24 11:10 1427次阅读

    音视频一体化解决方案

    随着数字化转型加速,音视频技术在各行业深度应用,传统音视频分散式管理系统面临多源异构设备接入困难、数据孤岛林立、运维复杂、协作效率低下等挑战,各行业对信息技术的需求逐渐从单一化向集成化
    的头像 发表于 04-24 09:14 1339次阅读