主题:WNDWJ,关于文本批处理的问题,高手请进!!
正序浏览
主题图片汇总
主题内检索
泡菜
泡网分: 2.314
主题: 22
帖子: 602
注册: 2008年7月
最近在做些研究,从一个数据库里下载了上百篇文章,但这些文章都是数据库自动格式化的,都在一个Word文档里了……

现在的问题是:怎样把这样一个word文档里的一篇篇文章分开,每篇文章另存为一个.txt文件呢?这些文章有一个共性,就是文章标题上面会显示“x of 177 DOCUMENTS”,x表示文章序数。怎样利用这个共性吧这一个巨大的word文档分成177个txt文件呢?

找了若干文档批处理软件,都没法做到。这些文章长短不一,所以不能用一些批处理软件里的“每两页断开”的功能。

都说无忌万能,各位高手支支招吧~~时间有点紧~先谢过了!
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
浏览:235 回帖:7
第 1 页 / 共 1 页
游客没有回帖权限
资深泡菜
泡网分: 27.542
主题: 42
帖子: 6879
注册: 2004年11月
录了一下,加上循环,看得懂就用。

Sub Macro1()
    
For i = 1 To 5
    Selection.Find.ClearFormatting
    With Selection.Find
        .Text = "of 177 DOCUMENTS"
        .Replacement.Text = ""
        .Forward = True
        .Wrap = wdFindContinue
        .Format = False
        .MatchCase = False
        .MatchWholeWord = False
        .MatchByte = True
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute
    Selection.Find.Execute
    Selection.HomeKey Unit:=wdLine
    Selection.HomeKey Unit:=wdStory, Extend:=wdExtend
    Selection.Cut
    Application.Move Left:=0, Top:=0
    Documents.Add DocumentType:=wdNewBlankDocument
    Selection.PasteAndFormat (wdPasteDefault)
    ChangeFileOpenDirectory "C:\"
    ActiveDocument.SaveAs FileName:=Str(i) + " of 177 DOCUMENTS.txt", FileFormat:= _
        wdFormatText, LockComments:=False, Password:="", AddToRecentFiles:=True, _
        WritePassword:="", ReadOnlyRecommended:=False, EmbedTrueTypeFonts:=False, _
         SaveNativePictureFormat:=False, SaveFormsData:=False, SaveAsAOCELetter:= _
        False, Encoding:=936, InsertLineBreaks:=False, AllowSubstitutions:=False, _
         LineEnding:=wdCRLF
    ActiveWindow.Close
Next i

End Sub
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
泡菜
泡网分: 0
主题: 12
帖子: 32
注册: 2008年11月
word -> txt | sed
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
泡菜
泡网分: 21.593
主题: 34
帖子: 477
注册: 2003年6月
文件发给我,我帮你试试
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
泡菜
泡网分: 9.995
主题: 32
帖子: 316
注册: 2008年10月
1、word另存一个大的txt。
2、CuttBook这个好像可以用关键词切吧,没用过,看介绍上有

实在不行,编一段小程序,很容易做吧
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
禁言中
泡网分: 6.346
主题: 22
帖子: 40
注册: 2008年4月
可以用Apache POI解决。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
泡菜
泡网分: 2.314
主题: 22
帖子: 602
注册: 2008年7月
原文由 RichardYang 发表
把word转成txt,然后用perl


要说语言的话用office自带的宏应该也可以……

但是……我不懂编程……时间紧迫也来不及学了……
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
资深泡菜
泡网分: 13.273
主题: 4
帖子: 963
注册: 2008年5月
把word转成txt,然后用perl
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
回复主题: WNDWJ,关于文本批处理的问题,高手请进!!
功能受限
游客无回复权限,请登录后再试