骤雨打新荷
» 游客:  注册 | 登录 | 会员 | 社区银行 | 股票中心 | 帮助

 

作者:
标题: [集图知识]CSV整理规范及制作流程 上一主题 | 下一主题
txfzq
管理员




积分 33428
发帖 13147
注册 2005-5-26
状态 离线
#1  [集图知识]CSV整理规范及制作流程

制作CSV(关于CSV说明见附录)是为了更好得推广交流 与更多的朋友分享自己整理的图集 任何人无论其收集渠道如何 只要有CSV都能确认自己的图集是否为官网原图 图集完整性如何 一旦自己制作的CSV被认可 会成为同好收集的参考标准(在mIRC集图圈及遵守该交流体系的圈子 你的CSV会被视为唯一标准)因此制作CSV是件非常严肃认真的事情 需要遵循相应的规范流程

作为某图站/扫家的整理发布者 首先要考虑几个问题

1.是用CD还是DVD容量来分盘(因为不少人还是倾向于刻盘保存) 选择哪种可根据月发布量 每个图辑的大小等情况来确定 举例来说minisuka.tv 09年3月发布量1500+ 大小1G+ 平均每个图辑大小在100M以上 显然用DVD分盘为宜

2.涉及图片和视频的图站是分别整理还是合在一起整理 一般来说我是根据较少部分所占总容量的30%作为分界岭来确定 小于30%的合在一起 比如以图片为主 视频为辅的Beautyleg 或视频为主 图片为辅的Camgal de CosPlay(CDC) 超过30%的 比如图片 视频所占比重相差不大的Graphis 则分开整理成Photo和Video

确定上述问题之后 下一步就是图集的整理归类了 具体来说就是各个目录的命名 目录命名方式通常是发布时间+model(英文)+编号/系列号/图辑名称 比如pier999 采用的是发布时间+model+系列号 2008-03-18 - Aneta Keys - Set 19 再如Graphis 采用的是发布时间+model+图辑名称 如2009-01-23 Rie Sakura - [Thaw]

西图数码图站 一般就建立各个图辑的目录即可 如果月发布量比较多 又是按DVD分盘 导致1级目录数量过多 可加设各个月份的目录 收录所属月份的图集 如2008-08\2008-08-12 - Cindy & Patty - Set 01

而亚图数码图站的整理相对要麻烦些 首先是大部分图站设立了各个子系列 比如Graphis就设立了Feti Style/First Gravure/Graphis Gals/Limited Edition等 minisuka.tv设立了Limited Gallery、Regular Gallery、Special Gallery、Wallpaper等 而我们整理的时候也要完全遵循网站的结构来 其次是涉及日文model名字和图辑名称如何处理 比如For-side的这一图集2008.05.09 - Mikie Hara (原幹恵) - 君といた夏 因为制作的CSV是面向全球集图爱好者推广的 因此目录名字上不能有中文(big5 GB编码) 日文 韩文等非英文 不过可以单独做一个文本 PDF html文件(须用utf-8编码保存)来完整记录信息

下面开始介绍CSV的制作流程 (操作见附图 点击看大图)

1.首先用hunter软件的check jpg file for transmission errors功能来检查是否有损坏的图片


2.用The!Checker或hunter软件生成CSV文件(你可以在CSV名字上加入你的整理者标记 不超过5个字符 比如我整理的minisuka.tv_Photo_2008-DVD1_WM_6313.csv WM就是我的整理者标记 加入标记一是对自己辛苦工作的自我认可 二是以区别其他人整理版本他人若发现问题 可根据标记来联系对应的整理者)
使用The!Checker生成CSV


使用Hunter生成CSV


3.用CSV WorkShop来检查生成的CSV是否存在问题



如果你是追求完美的整理者 可先与同好互相比对 再正式发布

各类工具及教程下载 (不可直接下载RS链接 需先用浏览器访问)
The!Checker 4.2英文版
http://rapidshare.com/files/236908381/PicCheck_v420.zip

The!Checker 4.18汉化版
http://rapidshare.com/files/236907726/PicCheck_v418_gc.zip

Hunter 2.1英文版
http://rapidshare.com/files/236909586/Hunter.zip

CSV WorkShop 1.0.0.6 英文版
http://rapidshare.com/files/236908790/CSV_Workshop.rar

附录:
引述集图前辈台湾图海明灯管理员loudmouse的相关文章(本人略有删减补充)

  Quote:
认识CSV档案

===档案描述===
CSV是COMMA SEPARATED VALUE的缩写,如果机器上安装有Excel软件,点选CSV文件将以EXCEL的模式开启。但由于计算机档案数据转换的原因,Excel会将其CRC之数值改做科学记号方式储存,从而造成档案中的CRC值发生错误,因此建议大家用写字板作为CSV文件的默认开启方式(在打开方式里设定)
  
开启后的CSV档包含了四或五个字段(部分),由左至右分别记载着:文件名称(XXXX.JPG)、档案大小(以BYTE为单位)、CRC32值(八个英文字母或数字组成)、档案相对路径(档案存放的相对路径)和档案内容描述(个别有)

===效用说明===
各位小时候大概都有集邮的经验吧,邮政总局每年都会出一本邮票年鉴,提供集邮者作为收集的依据。而扫图家或数码图站呢,每隔一段时间就会由扫图者本人或有经验的集图者整理发布CSV文件,作为其他集图者收集的依据,而有了CSV文件之后,便可利用专门的查验程序来检核你现有的图藏的完整性与正确性,并进行归类。此外也可依据生成的查验报告及MW(Missing & Wrong)CSV文件 向其它的收藏家请求补图。 一般来说最具公信力的当然是扫图家和数码图站自行制作的CSV FILE,通常称之为OFFICIAL CSV FILE,但因种种原因,CSV文件通常是由集图大家来整理发布。  

===CRC的说明===
CRC32是32BIT CYCLIC REDUNDANCY CHECK的缩写,它是CSV FILE中的一部份,也是一种纪录图片档案传输的计算数值,而每一张图片都有其独立的CRC值。 打个比方来说,把一个人比作一张图,图片的文件名就如同是人的姓名,而图片的CRC值就如同是人的身分证字号了,也就是说:全国可能有好几个「王大明」,但他们的身分证字号是绝对不同的。

CRC最大的功用是在于当图片文件名遭人更改时,只要CRC值正确,查验软件会自动辨识并将档名修正回来,就如同「王大明」如果用匿名「王小明」行走江湖,但只要知道他的身分证字号,便可查到他的真实姓名。

===CSV的迷思===
在使用软件认证图片时可能会出现这样的状况,图片本身没有任何肉眼所见的瑕疵,收集渠道也绝无问题(比如拥有官网账号的),那为什么会不符CSV呢?
根据我个人经验,存在如下几种情况会造成这样的状况

1.Model名字修正/编号修正/logo替换 比如有些网站如pier999在发布图辑后,发现model名字或图辑编号弄错了,会去纠正替换原图,还有些网站如misha在更换为新logo后,会替换部分之前的旧图  
2.再修饰的图片/忘压缩的图片 数码拍摄的毛片通常要经过后期软件处理才能发布到网站上,有时可能是为精益求精,某些图站如Graphis会在未做任何说明情况下 发布再修饰的图片替换原图,也有可能是某个粗心处理者漏了一张图沒压缩就上传了,比如beautyleg某个图辑有张图大小明显比其余的大不少,后来官网在2小时候后紧急修正

个人以为,如果是要去交流推广,以便与更多同好分享话,尽可能以官网现有的图为准.如果只是自己检查核对只用,那么只要不涉及Model名字修正/编号修正/logo替换,倒也没必要非得追求与CSV完全一致

===以程序鉴定真迹===
所谓的以程序分类作品,其实就是利用一个叫做THE!CHECKER或hunter的程序,配合CSV档案的使用,经过一些适当的设定后,便可以检查你的图库中是否有重复或破损的图,并分辨你所收集的图是否相同于扫图家的源文件;经过进阶的设定后,更可以将你的图库自动分类整理,并将文件名称自动修正为原始正确档名。
对照集邮而言,邮友必须检视自己所有的收集是否有破损,并且要对照年鉴才能知道自己的收集是否完整,然而这样耗时又费神的工作,套用在图片的收集上,却因为THE!CHECKER程序的发明,而变得轻松无比,只要把一些设定做好,接下来的动作就是按下按钮并等待结果。
THE!CHECKER程序和CSV档案这两样东西加起来,就如同式集图家的照妖镜,让所有经过修改的档案现出原形,并可选择性的将重复档案自动删除,是成为一个优秀集图家不可或缺的利器。





2009-5-25 22:09
查看资料  发短消息   编辑帖子  引用回复


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转:  



[ 联系我们 - 骤雨打新荷 ]

Powered by Discuz! 2.5 © 2001-2005 Comsenz Technology Ltd.