《数字媒体技术》


课程信息

《数字媒体计算》主要涉及计算机视觉、数字图象处理、人工智能等多个研究方向。

注意:每次访问请刷新页面,确保能看到最近的更新。

教学情况

成绩评定主要包含三部分内容:考勤(10%)+ 编程作业(40%)+ 期末考试(50%)。

编程作业:课后编程作业同学选择部分完成,评分由老师综合编程小作业和大作业的完成情况,依据工作量和难度评定。分数段约为:>90分:15%,80-90:35%,70-80:35%,<70:15%。百分比基准为完成作业检查的同学数量。还有未检查的同学考试完成后两周内在老师处登记作业内容,提交电子版说明(该情况评分将受到较大影响)。

作业检查:平时上机课时助教老师检查小作业,考试结束后安排大作业在线答辩

考试安排

开卷,不能使用电子产品,以问答题为主。题目相对灵活,主要考察对课程知识的理解。有计算题,考试需要携带计算器

时间:15周 周五(2021.12.17)下午 14:00 - 16:00

地点:A阶201 (计科1901-1903),A阶202(计科1904-1906),A阶203(计科1907-1908 及其他)

教学课件

图像处理与视觉

图像处理和视觉相关课件内容得到Cornell大学CS4670/5670的帮助。

对应教材:Computer Vision: Algorithms and Applications (online), by Richard Szeliski


图像和照片

图像相关基础知识(PDF

计科作业:使用OpenCV实现图像的基本编辑处理(对比度、饱和度、亮度等)

数媒作业:使用图像编辑软件实现基于色彩变换的图像编辑

扩展:可参考IrfanView等软件,实现一个功能丰富的系统

图像滤波

滤波基础知识,简单线性滤波方法、导向图滤波等(PDF

计科作业:使用OpenCV函数或自己编程实现各种滤波处理

数媒作业:使用图像编辑软件实现基于滤波的图像编辑

图像处理示例

暗通道去雾、SeamCarving、Colorization等(PDF

计科作业:实现课程中涉及的相关算法

数媒作业:使用软件完成课件中某一效果的实现,也可完成其他复杂效果(fusecolorization

图像特征1

SIFT特征及其应用(PDF

计科作业:利用OpenCV函数实现Sift特征的提取和匹配、实现图像拼接

扩展:利用Sift特征匹配实现在大规模数据集(1000以上)中的图像快速(1秒以内)检索

数媒作业:使用软件完成复杂高清全景图拼接

图像特征2

HOG特征及其应用(PDF

Demo示例:HOG特征实现手写数字图像的分类

编程作业:利用OpenCV函数实现HOG特征的提取

扩展:编程实现HOG特征;完成基于HOG特征的图像分类或物体检测

深度学习

深度学习的基本概念、神经网络的前向和反向传播、卷积神经网络基本概念、Tensorflow示例(PDF

GAN生成对抗网络的介绍(PDF

Demo示例:三层网络的Tensorflow实现MNIST手写数字图像的分类

编程作业:基于深度学习框架,利用神经网络完成函数拟合

扩展:深度学习相关的研究性题目

视频基础

视频及其基本属性概念、DirectShow、OpenCV Video、应用示例(PDF

Demo示例:tracker跟踪stablization视频稳定

编程作业:利用OpenCV实现一段视频应用

扩展:视频分析相关的研究性题目

课程资源

OpenCV https://opencv.org/

OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

TensorFlow https://tensorflow.google.cn/

TensorFlow™是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现,其前身是谷歌的神经网络算法库DistBelief。Tensorflow拥有多层级结构,可部署于各类服务器、PC终端和网页并支持GPU和TPU高性能数值计算,被广泛应用于谷歌内部的产品开发和各领域的科学研究。


Notice: All the digital papers and videos in this website are author's version for personal use only

page counter
Hit Counters